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(54) Title: QUALITATIVE DIFFERENTIAL SCREENING 
(54)Titre: CRIBLAGE DIFFERENTDEL QUALTTATIF 
(57) Abstract 

Tlie invention concerns a method for identifying and/or cloning nucleic acid regions representing qualitative <urTercnces assccia^ 
with alternative splicing events and/or with insertions, deletions located in RNA transcribed genome regions between two physiological 
situations, comprising either hybridisation of RNA derived from the test situation with cDNA's denved from "^J^ 
reciprocally, or double-strand hybridisation of cDNA derived from the test situation with cDNA's derived from the reference situation, and 
identifying and/or cloning nucleic acids representing qualitative differences. The invention also concerns compositions or banks of nucleic 
acids representing qualitative differences between two physiological situations, obtainable by the above method, and their use as probe, 
for identifying genes or molecules of interest, or still for example in methods of pharmacogenomics and profiling of molecules relative to 
their therapeutic and/or toxic effects. The invention further concerns the use of dysregulation of splicing RNA as markers for predicting 
molecule toxicity and/or efficacy, and as markers in pharmacogenomics. 

(57) Abrege* 

L'invention conceme un procexte d' identification et/ou de clonage de regions d'acides nuclflques representatives de differences 
qualitatives associees a des 6v6nements d'dpissages altematifs et/ou a des insertions, d616tions se trouvant dans des regions du gdnome 
tainscrites en ARN, entre deux situations physiologiques, comprenant soit rhybridation d'ARN provenant de la situation test avec les 
ADNc provenant de la situation de reference et/ou reciproquement, soit rhybridation d'ADNc double-brin provenant de la situation test 
avec les ADNc provenant de la situation de reference et 1' identification et/ou le clonage d'acides nucl&ques representaufs des differences 
qualitatives. L'invention conceme dgalement des compositions ou banques d'acides nucteiques representatifs de differences qualitatives 
entre deux situations physiologiques, susceptibles d'etre obtenues par le procede decrit ci-dessus, ainsi que leur utilisation comme sonde, 
pour 1'identification de gfenes ou molecules d'interet, ou encore par exemple dans des m6thodes de pharmacogenomique, et de profilage de 
molecules vis a vis de leurs effets therapeutiques et/ou toxiques. L'invention conceme aussi 1'utilisation des dysnSgulations de 1 epissage des 
ARN comme marqueurs de prediction de la toxicite et/ou de l'efficacite de molecules, ainsi que comme marqueurs de pharmacogenomique. 
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CR1BLAGE DIFFERENT1EL QUALITAT1F 
Cette invention se rapporte aux domaines techniques de ia 
biotechnologie, de la medecine, de .la biologie et de la biochimie. Ses 
applications concernent les domaines de la sante humaine, animate et 
5 vegetale. Plus particulierement, Nnvention permet d' identifier des sequences 
d'acides nucleiques permettant de concevoir de nouveaux cribles pour 
molecules d'interet therapeutique, de nouveaux outils de therapie genique 
ainsi que d'apporter des indications sur le potentiel toxique et le suivi 
d'efficacite de molecules et des informations de pharmacogenomique. 
10 La presente invention decrit notamment une serie de 

techniques originates d' identification de sequences d'acides nucleiques 
basee sur la mise en evidence des differences qualitatives entre les ARN 
issus de deux contextes differents que Ton desire comparer, en particular 
issus d'un tissu ou-d'-un organe malade et leur equivalent sain. -Plus- 
is precisement, ces techniques sont destinees a doner specifiquement les 
introns et les exons altematifs episses differentiellement entre une situation 
pathologique et un etat sain ou entre deux situations physiologiques que Ton 
desire comparer. Ces differences qualitatives au sein des ARNs peuvent 
egalement provenir d'alteration(s) du genome, de type insertions ou 
20 deletions dans des regions qui seront transcrites en ARN. Cette serie de 
techniques est identifiee par I'acronyme DATAS : Differential Analysis of 
Transcripts with Alternative Splicing. 

La caracterisation des alterations de I'expression genetique qui 
president ou sbnt associees a une pathologie donnee suscite un espoir 
25 important de decouvrir de nouvelles cibles therapeutiques et de nouveaux 
outils diagnostiques. Toutefois, I' identification d'une sequence d'ADN 
genomique ou complementaire, qu'elle ait lieu par clonage positionnel ou par 
des techniques de criblage differentiel quantitatif, n'apporte que peu ou pas 
d'information sur la fonction et encore moins sur les domaines fonctionnels 
30 mis en jeu dans les deregulations liees a la pathologie etudiee. La presente 
invention decrit une serie de techniques originates qui visent a identifier les 
differences d'epissages des ARNs qui existent entre deux situations 



Best Available Copy 2 

physiopathologiques distinctes. ^identification de ces differences apporte 
des informations sur les differences qualitatives et non sur les differences 
quantitatives comme c'est !e cas pour les techniques decrites jusqu'a 
present. L'ensemble des techniques presentees dans la presente invention 

5 sont done regroupees sous I'appellation "criblage differentiel qualitatif' ou 
DATAS. Les methodes de I'invention sont utilisables pour I'identification de 
nouvelles cibles ou produits therapeutiques, pour la preparation d'outils de 
recherche genetique et/ou d'outils de diagnostic, pour la construction de 
banques d'acides nucleiques, et dans des methodes de determination du 

10 profit toxicologique ou de Pefficacite d'un compose par exemple. 

Un premier objet de I'invention reside plus particulierement 
dans un precede d'identification et/ou de clonage de regions d'acides 
nucleiques representatives de differences genetiques qualitatives entre deux 
e ch a nt i l l ons — bio l ogiques j— comprenant une etape d^ybridatien — d'un o 

15 population d'ARN ou d'ADNc double-brin provenant d'un premier echantillon 
biologique avec une population d'ADNc provenant d'un deuxieme echantillon 
biologique (Figure 1A). 

Comme indique ci-avant, les differences genetiques qualitatives 
peuvent etre dues a des modifications d'epissage des ARN ou a des 

20 deletions et/ou insertions dans des regions du genome qui sont transcrites 
en ARN. 

Dans un premier mode de realisation, il s'agit d'une hybridation 
entre une population d'ARN provenant d'un premier echantillon biologique et 
une population d'ADNc (simple-brin ou double-brin) provenant d'un deuxieme 

25 echantillon biologique. 

Dans un autre mode de realisation, il s'agit d'une hybridation 
entre une population d'ADNc double-brin provenant d'un premier echantillon 
biologique et une population d'ADNc (double-brin ou, preferentiellement 
simple-brin) provenant d'un deuxieme echantillon biologique. 

30 Un objet plus particulier de I'invention reside dans un precede 

d'identification de regions d'acides nucleiques epissees differentiellement 
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entre deux situations physiologiques, comprenant I'hybridation d'une 
population d'ARN ou d'ADNc double-brin provenant d'une situation test avec 
une population d'ADNc provenant d'une situation de reference et 
('identification d'acides nucleiques correspondant a des epissages 
5 differentiels. 

Un autre objet de I'invention concerne un precede de clonage 
d'acides nucleiques episses differentiellement entre deux situations 
physiologiques, comprenant I'hybridation d'une population d'ARN ou d'ADNc 
double-brin provenant de la situation test avec une population d'ADNc 
10 provenant de la situation de reference et le clonage d'acides nucleiques 
correspondant a des epissages differentiels. 

Dans un mode particulier de mise en oeuvre, le procede 
d'identification et/ou de clonage d'acides nucleiques de I'invention comprend 
deux-hybndations paralleles : - — — 



(situation test) avec ies ADNc provenant du deuxieme echantillon (situation 
de reference); 

(b) I'hybridation des ARN provenant du deuxieme echantillon 
(situation de reference) avec Ies ADNc provenant du premier echantillon 

20 (situation test); et 

(c) ('identification et/ou le clonage, a partir des hybrides formes 
en (a) et (b) d'acides nucleiques correspondant a des differences genetiques 
qualitatives. 

La presente invention concerne egalement la preparation de 
25 banques d'acides nucleiques, Ies acides nucleiques et banques ainsi 
obtenus, ainsi que Ies utilisations de ces materiels dans tous Ies domaines 
de la biologie/biotechnologie, comme illustre plus loin. 

A cet egard, I'invention est egalement relative a un procede de 
preparation de compositions ou banques d'acides nucleiques profilees, 
30 representatives des differences qualitatives existant entre deux echantillons 
biologiques, comprenant une etape d'hybridation d'une population d'ARN 




15 



(a) I'hybridation des ARN provenant du premier echantillon 
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provenant d'un premier echantillon biologique avec une population d'ADNc 
. provenant d'un deuxieme echantillon biologique. 

L'invention concerne en outre une methode de profilage 
("profiling") d'une composition d'ADNc, comprenant une etape d'hybridation 

5 de cette composition avec une population d'ARN, ou inversement. 

Comme indique ci avant, la presente invention concerne en 
particulier des methodes d'identification et de clonage d'acides nucleiques 
representatifs d'un etat physiologique. En outre, les acides nucleiques 
identifies et/ou clones represented les qualites d'un etat physiologique en ce 

10 sens que ces acides nucleiques sont generalement en grande partie 
impliques dans I'etat physiologique observe. De ce fait, les methodes 
qualitatives de l'invention donnent acces directement aux elements 
genetiques ou a leur produit proteique, ayant un role fonctionnel dans le 

developpement d'un etat physiopathologique. . ... - -■- 

15 Les methodes selon l'invention reposent en partie sur une 

etape originate d'hybridation croisee entre des ARN et des ADNc de 
situations physiologiques differentes. Cette ou ces hybridations croisees 
permettent avantageusement de mettre en evidence, dans les hybrides 
formes, des regions non appariees, c'est-a-dire des regions presentes dans 

20 les ARNs dans une situation physiologique donnee et pas dans les ARNs 
dans une autre situation physiologique. Ces regions correspondent 
essentiellement a des epissages alternatifs caracteristiques d'un etat 
physiologique, mais peuvent egalement refleter des alterations genetiques 
de type insertions ou deletions, et constituent ainsi des elements genetiques 

25 particulierement utiles sur le plan therapeutique ou diagnostic comme 
explique ci-apres. L'invention consiste done notamment a conserver les 
complexes formes apres hybridation(s) croisee(s), afin d'en extraire les 
regions correspondant a des differences qualitatives. Cette methodologie se 
differencie des techniques de soustractions quantitatives connues de 

30 I'homme de I'art ( Sargent and Dawid (1983), Science, 222, 135-139 ; Davis 
et.al. (1984), PNAS, 81, 2194-2198 ; Duguid and Dinauer (1990) Nuc. Acid 
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Res., 18, 2789-2792 ; Diatchenko et.al. (1996) PNAS, 93, 6025-6030). qui 
apres hybridation(s), eliminent les hybrides formes pour ne conserver que les 
acides nucleiques non complexes. 

L'invention concerne done en premier lieu un procede 
5 d'identification d'acides nucleiques d'interet comprenant I'hybridation entre 
les ARN d'un echantillon test et les ADNc d'un echantillon de reference. 
Cette hybridation permet de mettre en evidence, au sein des complexes 
formes, des differences genetiques qualitatives entre les situations testees, 
et ainsi d'identifier et/ou de doner par exemple les epissages 

10 caracteristiques de la situation test. 

Selon une premiere variante de l'invention, le procede permet 
done de generer une population d'acides nucleiques caracteristiques des 
epissages de I'etat physiologique test par rapport a I'etat de reference (Figure 
1A, 1B). Comme indique-ci-ap res , c ette population -peut etre utilisee pour le - - 

15 clonage et la caracterisation des acides nucleiques, leur utilisation en 
diagnostic, criblage, therapeutique ou pour la production d'anticorps ou de 
fragments proteiques ou de proteines entieres. Cette population peut 
egalement servir a la constitution de banques utilisables dans differents 
domaines d'applications illustres plus loin et a la realisation de sondes 

20 marquees (Figure 1 D). 

Selon une autre variante de l'invention, le procede comprend 
une premiere hybridation telle que decrite ci avant et une seconde 
hybridation, en parallele, entre les ARN provenant de la situation de 
reference et les ADNc provenant de la situation test. Cette variante est 

25 particulierement avantageuse puisqu'elle permet de generer deux 
populations d'acides nucleiques, Tune representant les qualites de la 
situation test par rapport a la situation de reference, et I'autre les qualites de 
la situation de reference par rapport a la situation test (Figure 1C). Ces deux 
populations peuvent egalement etre utilisees comme source d'acides 

30 nucleiques, ainsi que comme banques temoignant de I'empreinte genetique 
d'une situation physiologique donnee, comme detaille plus loin (Figure 1 D). 
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La presente invention - peut- etre appliquee a tous types 
d'echantillons biologiques. En particuiier, Pechantillon biologique peut etre 
toute cellule, organe, tissu, prelevement, biopsie, etc., contenant des acides 

5 nucleiques. S'agissant d'un organe, tissu ou biopsie, ils sont eventuellement 
mis en culture de maniere a permettre I'acces aux cellules qui Ies 
composent. II peut s'agir d'echantillons provenant de mammiferes (en 
particuiier Phomme), de vegetaux, de bacteries ou de cellules eucaryotes 
inferieures (levures, cellules fongiques, etc.). Des exemples de materiels 

10 sont en particuiier une biopsie de tumeur, une biopsie de plaques 
neurodegeneratives ou d'aires cerebrates presentant des atteintes 
neurodegeneratives, un echantillon de peau, un echantillon de cellules 
sanguines obtenues apres prise de sang, une biopsie colorectale, des 
biopsiesJssues.d e l a v a ges p u lmonaires , etc> D es exemples de cellules sont- 

15 notamment Ies cellules musculaires, hepatiques, fibroblastes, nerveuses, de 
I'epiderme, du derme, des cellules sanguines comme Ies lymphocytes B, T, 
Ies mastocytes, Ies monocytes, Ies granulocytes, Ies macrophages. 

Comme indique ci avant, le criblage differentiel qualitatif selon 
la presente invention permet d'identifier des acides nucleiques 

20 caracteristiques d'une situation physiologique donnee (situation B) par 
rapport a une situation physiologique de reference (situation A), en vue de 
leur clonage ou autres utilisations. A titre illustratif, ies situations 
physiologiques A et B etudiees peuvent etre Ies suivantes : 



Situation A 


Situation B 


echantillon sain 


echantillon pathologique 


Echantillon sain 


echantillon apoptotique 


echantillon sain 


echantillon apres. infection virale 


Echantillon sensible a X 


echantillon resistant a X 
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ecnantiiion non traite 


ecnantiiion traite (par exempie 
par compose toxique) 


echantillon non difference 


echantillon ayant subi une 
urrierenuauon ceuuiaire ou 
tissulaire 



Populations d'ARN 

Pour la mise en ceuvre de la presente invention, il est possible 

5 d'utiliser des ARN totaux ou les ARN messagers. Ces ARN peuvent etre 
prepares par toutes methodes classiques de biologie moleculaire, bien 
connues de 1'homme du metier. Ces methodes comprennent generalement 
une lyse des cellules ou tissu ou echantillons et I'isolement des ARNs par 
— 4es- techniqu es d'cxtract i on. I I peut -s'agir en particulier d'un traitement- atr 

10 moyen d'agents chaotropiques tels que le thiocyanate de guanidium (qui 
detruit les cellules et protege les ARN) suivi d'une extraction des ARN au 
moyen de solvants (phenol, chloroforme par exempie). De telles methodes 
sont bien connues de 1'homme du metier (voir Maniatis et al., Chomczynski et 
al., Anal. Biochem. 162 (1987) 156). Ces methodes peuvent etre aisement 

is pratiquees en utilisant des kits disponibles dans le commerce tels que par 
exempie le kit US73750 (Amersham) ou le kit Rneasy (Quiagen) pour les 
ARN totaux. II n'est pas necessaire que les ARN utilises soient parfaitement 
purs, et notamment il n'est pas genant que des traces d'ADN genomique ou 
d'autres composants cellulaires (proteine, etc.) subsistent dans les 

20 preparations, des lors qu'ils n'affectent pas significativement la stabilite des 
ARNs et que les modes de preparation entre les differents echantillons a 
comparer soient les memes. En outre, de maniere facultative, il est possible 
d'utiliser non pas des preparations d'ARN totaux mais des preparations 
d'ARN messagers. Ceux-ci peuvent etre isoles, soit directement a partir de 

25 I'echantillon biologique soit a partir des ARN totaux, au moyen de sequences 
polyT, seion les methodes classiques. L'obtention d'ARN messagers peut a 
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cet egard etre realisee au moyen de kits commerciaux tels que par exemple 
le kit US72700 (Amersham) ou le kit utilisant des billes oligo-(dT) (Dynal). Un 
mode avantageux de preparation d'ARN consiste a extraire les ARN 
cytosoliques puis les ARN polyA+ cytosoliques. Des kits permettant la 
5 preparation selective d'ARN cytosoliques non contamines avec des ARN 
premessagers porteurs d'exons et d'introns non episses sont disponibles 
dans le commerce. C'est le cas notamment des kits Rneasy commercialises 
par Qiagen (exemple de reference: 74103). Les ARN peuvent egalement 
etre obtenus directement a partir de banques ou autres echantillons prepares 

10 a I'avance et/ou accessibles dans des collections, conserves dans des 
conditions appropn*6es. 

Generalement, les preparations d'ARN utilisees comprennent 
avantageusement au moins 0,1 ug d'ARN, de preference au moins 0,5ug 

— d'ARN . L es quant i tes peuv ent- varier selon -les cellules-et les methedes- 

15 utilisees, sans modifier la mise en oeuvre de la presente invention. Pour 
obtenir des quantites d'ARN suffisantes (de preference 0,1 ug au moins), il 
est generalement recommande d'utiliser un echantillon biologique 
comprenant au moins 10 5 cellules. A cet egard, une biopsie classique 
comprend generalement entre 10 5 et 10 8 cellules, et une culture cellulaire sur 

20 boite de petri classique (diametre 6-10 cm) comporte de I'ordre de 10 6 
cellules, ce qui permet d'obtenir aisement des quantites d'ARN suffisantes. 

Les preparations d'ARN peuvent etre utilisees 
extemporanement ou etre conservees, de preference au froid, en solution ou 
congelees, pour des utilisations ulterieures. 

25 

Populations d'ADNc 

Les ADNc utilises dans le cadre de la presente invention 
peuvent etre obtenus par transcription inverse selon les techniques 
classiques de biologie moleculaire. On peut se referer notamment a Maniatis 
30 et al. La transcription inverse est generalement realisee en utilisant une 
enzyme, transcriptase inverse ("reverse transcriptase") et une amorce. 
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A cet egard, de nombreuses transcriptases inverses ont ete 
decrites dans la litterature et sont disponibles dans le commerce (Kit 
1483188, Boehringer). On peut citer a titre d'exemples les transcriptases 
inverses les plus souvent utilisees comme celles du virus aviaire AMV (Avian 
5 Myeloblastosis Virus) et du virus de leucemie murine MMLV (Moloney Murine 
Leukemia Virus). II convient egalement de citer certaines DNA polymerase 
thermostabies douees d'activite transcriptase inverse telles celles isolees de 
Thermus flavus et de Thermus thermophilus HB-8 (commercialement 
disponibles; references Promega M1941 et M2101). Selon une variante 

10 avantageuse, on utilise pour la mise en oeuvre de la presente invention la 
transcriptase inverse d'AMV puisque cette enzyme, fonctionnant a 42°C 
(contrairement a celle de MMLV qui fonctionne a 37°C), destabilise certaines 
structures secondares des ARN qui pourraient bloquer Pelongation, et 

p ermet a i ns i la transcrip t io n inv erse- d'ARN de longueur importante, et-pefmet 

15 d'avoir des preparations d'ADNc representant les ARN avec une grande 
fidelite et une grande efficacite. 

Selon une autre variante avantageuse de I'invention, on utilise une 
transcriptase inverse depourvue d'activite RNaseH. L'utilisation de ce type 
d'enzyme offre plusieurs avantages, et notamment celui d'augmenter le 

20 rendement de synthese des ADNc et de prevenir toute degradation des 
ARN, qui seront ensuite engages dans des heteroduplex avec les ADNc 
neosynthetises, permettant ainsi eventuellement de se passer de I'extraction 
ph6nolique de ceux ci. Les transcriptases inverses depourvues d'activite 
RNaseH peuvent etre preparees a partir de toute transcriptase inverse par 

25 deletion(s) et/ou mutagenese. En outre, de telles enzymes sont egalement 
disponibles dans le commerce (par exemple Life Technologies, reference 
18053-017). 

Les conditions de mise en oeuvre des transcriptases inverses 
(concentration et temperature) sont bien connues de I'homme du metier. En 
30 particulier, on utilise generalement de 10 a 30 Unites d'enzyme par reaction, 
en presence d'une concentration optimale en Mg 2 * de 10 mM. 
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- La ou les amorces utilisees pour ia transcription inverse 

peuvent etre de natures differentes. II peut s'agir en particulier d'un 
oligonucleotide aleatoire ("random") comprenant de pr6ference entre 4 et 10 
5 nucleotides, avantageusement un hexanucleotide. L'utilisation de ce type 
d'amorce aleatoire a ete decrite dans la litterature et permet d'initier la 
transcription inverse en differentes positions au hasard au sein des 
molecules d'ARN. Cette technique est surtout employee pour la transcription 
inverse d'ARN totaux (c'est-a-dire comprenant les ARNm, les ARNt et les 

10 ARNr notamment). Dans le cas ou Ton souhaite realiser la transcription 
inverse des ARNm seulement, il est avantageux d'utiliser comme amorce un 
oligonucleotide oligo dT, qui permet d'initier la transcription inverse a partir 
des queues polyA specifiques des ARN messagers. L'oligonucleotide oligo 

_ dT pe uL-comprendre de 4 - a--20-meres^vantageuseroent-de 1 5' m ores 

15 environ. L'emploi de ce type d'amorce constitue un mode de realisation 
prefere de I'invention. D'autre part, il peut etre avantageux d'utiliser pour la 
transcription inverse une amorce marquee. Ceci peut en effet permettre de 
reconnaitre et/ou de selectionner et/ou de trier ulterieurement les ARN des 
ADNc. Ceci peut egalement permettre d'isoler les heteroduplex ARN/ADN 

20 dont la formation represente une etape clef de ['invention. Le marquage de 
I'amorce peut consister en tout systeme de type ligand-recepteur, c'est-a-dire 
permettant par affinite de separer les molecules portant I'amorce. II peut 
s'agir par exemple d'un marquage par la biotine, qui peut etre separe par tout 
support (bille, colonne, plaques, etc.) sur lequel est fixee la streptavidine. 

25 Tout autre systeme de marquage permettant cette separation sans affecter 
les proprietes d'amorce peut etre utilise de maniere equivalente. 

Dans les conditions habituelles de mise en oeuvre, cette 
transcription inverse genere des ADN complementaires (ADNc) simple-brins. 
Ceci constitue un premier mode avantageux de la presente invention. 

30 Dans une deuxieme variante de mise en oeuvre, la transcription 

inverse est realisee de maniere a preparer des ADNc double-brins. Pour ce 
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faire, apres transcription du premier brin d'ADNc, le deuxieme brin peut etre 
genere selon les techniques classiques de biologie moleculaire faisant 
intervenir des enzymes de modification de I'ADN comme I'ADN Ligase du 
phage T4, I'ADN polymerase I et I'ADN polymerase du phage T4. 
5 Les preparations d'ADNc peuvent etre utilisees 

extemporanement ou etre conservees, de preference au froid, en solution ou 
congelees, pour des utilisations ulterieures. 

Hvbridations 

10 Comme explique ci-avant, les methodes selon I'invention 

reposent en partie sur une etape originate d'hybridation croisee entre les 
ARN et les ADNc provenant d'echantillons biologiques dans des situations 
physiologiques ou d'origines differentes. Dans un mode de realisation 
prefere, hybridation -s e l on I' i nven tion-est-avantageusement realisee en 

15 phase liquide. En outre, elle peut etre effectuee dans tout dispositif 
approprie, tel que par exemple des tubes (Eppendorff, par exemple), des 
plaques, ou tout autre support adapte et couramment utilise en Biologie 
Moleculaire. L'hybridation est avantageusement realisee dans des volumes 
compris entre 10 et 1000 ul, par exemple entre 10 et 500 ul. II est entendu 

20 que le dispositif utilise et les volumes utilises peuvent etre aisement adaptes 
par I'homme du metier. Les quantites d'acides nucleiques utilisees pour 
l'hybridation sont egalement connues de I'homme du metier. En general, il 
est suffisant d'utiliser des microgrammes d'acides nucleiques, par exemple 
de I'ordre de 0,1 a 100 ug. 

25 Un element plus important dans la mise en oeuvre des 

hybridations reside dans les quantites respectives d'acides nucleiques 
utilisees. Ainsi, il est possible d'utiliser les acides nucleiques dans un rapport 
ADNc/ARN variant de 50 a 0,02 environ, de preference de 40 a 0,1. De 
maniere plus particulierement avantageuse, on prefere que le rapport 

30 ADNc/ARN soit proche ou superieur a 1 . En effet, dans ces experiences, 
TARN constitue le compose test ("tester") et I'ADNc constitue le porteur 
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("driver"). De ce fait, dans le but d'ameliorer ia specificite de la methode, il est 
preferable d'operer dans des conditions ou le "driver" se trouve en exces par 
rapport au "tester". En effet, dans ces conditions, Peffet de cooperativite entre 
les acides nucleiques joue et les appariements non-parfaits sont fortement 

5 defavorises. De ce fait, les seuls mesappariements qui apparaissent sont 
generalement dus a la presence de regions dans les ARN "tester" qui 
n'existent pas dans I'ADNc "driver" et qui sont done specifiques. Pour 
favoriser la specificite du procede, Phybridation est done avantageusement 
realisee a un rapport ADNc/ARN compris entre 1 environ et 10 environ. II est 

10 bien entendu que ce rapport peut etre adapte par rhomme du metier selon 
les conditions du procede (quantites d'acides nucleiques disponibles, 
situations physiologiques, but poursuivi, etc.). Les autres parametres de 
I'hybridation (temps, temperature, force ionique) sont egalement adaptables 

pa r I 'homme du metier . D e-maniere generaleapres denaturation des-^testei^- 

15 et "driver" (par chauffage par exemple), I'hybridation est realisee pendant 
environ 2 a 24 heures, a une temperature de 37°C environ (eventuellement 
soumise a des sauts de temperature comme decrit plus loin), et dans des 
conditions standard de force ionique (pouvant varier de 0,1 a 5M NaCI par 
exemple). II est connu que la force ionique est un des facteurs determinant la 

20 stringence d'une hybridation, notamment dans le cas d'hybridation sur 
support solide. 

Selon un mode de mise en oeuvre particulier de I'invention, 
I'hybridation est realisee en emulsion phenolique, par exemple selon la 
technique PERT ("Phenol Emulsion DNA Reassociation Technique) decrite 

25 par Kohne D.E. et al. (Biochemistry, Vol. 16, N° 24, pp 5329-5341, 1977). 
Avantageusement, on utilise dans le cadre de la presente invention 
I'hybridation en emulsion phenolique maintenue par thermocycles (sauts de 
temperature de 37°C environ a 60/65°C environ) et non par agitation, selon 
la technique decrite par Miller et Riblet (NAR 23 (1995) 2339). Toute autre 

30 technique d'hybridation en phase liquide, notamment en emulsion, peut etre 
utilisee dans le cadre de la presente invention. Ainsi, dans un autre mode 
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particulierement avantageux, ['hybridation est realisee dans une solution 
contenant 80% de formamide, a une temperature de 40 6 c par exempted - - 
L'hybridation peut egalement se faire avec Tun des partenaires 
immobilise sur un support. Avantageusement, c'est I'ADNc qui est 

5 immobilise. Cela peut etre realise en tirant profit du marquage dont peuvent 
faire I'objet les ADNc (voir ci-dessus) notamment grace a des amorces 
biotinylees. Les groupements biotine sont mis en presence de billes 
magnetiques sur lesquelles sont fixees des molecules de streptavidine. Les 
ADNc peuvent ensuite etre maintenus grace a un aimant au contact d'un 

10 filtre ou d'un puits de plaque de microtitration. Les ARN sont ensuite, dans 
les conditions de force ionique requise, mis en presence des ADNc. Les ARN 
non apparies sont elimines par lavage. Les ARN hybrides ainsi que les ADNc 
sont recuperes par retrait du champ magnetique. 

Dans- le cas ou --l- , ADNc--est- double-brin i -les-- -conditions - — 

15 d'hybridation utilisees sont essentiellement similaires a celles decrites ci- 
dessus, et adaptables par I'homme du metier. On prefere dans ce cas 
proceder a l'hybridation en presence de formamide et on expose les 
complexes a une gamme de temperatures allant par exemple de 60 a 40 °C, 
preferentiellement de 56 °C a 44 °C, afin de favoriser la formation de 

20 complexes de type R-loop. De plus, il est souhaitable d'ajouter, apres 
Thybridation, un agent de stabilisation des triplex formes, une fois la 
formamide retiree du milieu, tels que le glyoxal par exemple (Kaback et.al. 
(1979) Nuc. Acid Res., 6, 2499-2517). 

Ces hybridations croisees selon I'invention generent ainsi des 

25 compositions comprenant des heteroduplex ou heterotriplex ADNc/ARN, 
representant les qualites de chacune des situations physiologiques testees. 
Comme indique ci-avant, dans chacune de ces compositions, des acides 
nucleiques correspondant essentiellement a des epissages alternatifs 
differentiels ou a d'autres alterations genetiques, specifiques de chaque 

30 situation physiologique, peuvent etre identifies et/ou clones. 

L'invention concerne done avantageusement un precede 
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^identification et/ou de clonage de regions d'acides representatives de 
differences g6n6tiques entre deux situations physiologiques, comprenant 
une etape d'hybridation entre les ARN provenant d'un echantillon biologique 
dans une premiere situation physiologique et les ADNc simple-brins 
5 provenant d'un echantillon biologique dans une deuxieme situation 
physiologique, et ('identification et/ou le clonage, a partir des hybrides ainsi 
formes, des regions d'ARN non-appariees. 

Cette premiere variante repose plus particulierement sur la 
formation d'heteroduplex entre les ARN et les ADNc simple-brin (voir Figures 

10 2-4). Cette variante est avantageusement mise en oeuvre en utilisant des 
ARN messagers ou des ADNc produits par transcription inverse des ARN 
messagers essentiellement, c'est-a-dire en presence d'une amorce oligo dT. 

Dans un mode particulier de mise en oeuvre, le precede 

^^identification et/ou de clonage d^addes nucleiques -de l^inventio^ 

15 comprend : 

(a) I'hybridation d'ARN provenant de la situation test avec les 
ADNc simple-brin provenant de la situation de reference; 

(b) I'hybridation d'ARN provenant de la situation de reference 
avec les ADNc simple-brin provenant de la situation test; et 

20 (c) ('identification et/ou le clonage, a partir des hybrides formes 

en (a) et (b), de regions d'ARN non-appariees. 

Dans une variante particuliere de mise en oeuvre, le procede 
de I'invention comprend les etapes suivantes : 

(a) I'obtention d'ARN a partir d'un echantillon biologique dans 
25 une situation physiologique A (rA); 

(b) I'obtention d'ARN a partir d'un meme echantillon biologique 
dans une situation physiologique B (rB); 

(c) la preparation d'ADNc a partir d'une partie des ARN rA 
obtenus en (a) (ADN cA) et a partir d'une partie des ARN rB obtenus en (b) 

30 (ADN cB) au moyen d'amorces polyT, 

(d) I'hybridation en phase liquide d'une partie des ARN rA avec 
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une partie des ADN cB (pour generer des heteroduplex rA/cB) 

(e) I'hybridation en phase liquide d'une partie des ARN rB avec 
une partie des ADN cA (pour generer des heteroduplex rB/cA), 

(f) I'ident'rfication et/ou le cionage de regions d'ARN non 
5' appariees dans les heteroduplex rA/cB et rB/cA obtenus en (d) et en (e). 

Dans une- autre variante particuliere de mise en oeuvre, le 
procede de ['invention comprerid 1'hybridation d'ARN provenant de la 
situation test avec les ADNc double-brins provenant de la situation de 
reference, et I'identification et/ou le cionage des regions d'ADN double-brin 

10 maintenues. Cette deuxieme variante repose plus particulierement sur la 
formation d'heterotriplex entre les ARN et les ADNc double-brin, derive des 
structures de type R-loop (voir Figure 5). Cette variante est egalement 
preferentiellement mise en oeuvre en utilisant des ARN messagers ou des 

ADNc produits .. _par. transcription — inverse — des — ARN — messagers 

15 essentiellement, c'est-a-dire en presence d'une amorce polyT. Dans cette 
variante egalement, un mode de realisation particulier comprend deux 
hybridations paralleles, generant deux populations d'acides nucleiques selon 
I'invention. Dans cette variante, les regions recherchees, specifiques des 
epissages alternatifs, ne sont pas les regions d'ARN non appariees, mais 

20 des ADN double-brins qui n'ont pu etre deplaces par une sequence ARN 
homologue (voir Figure 5). 

Dans une autre variante de I'invention, le procede comprend, 
pour isoler les differences genetiques qualitatives (e.g., les differences 
d'epissage) qui existent entre deux echantillons, I'hybridation entre une 

25 population d'ADNc double-brin provenant d'un premier echantillon biologique 
et une population d'ADNc (double-brin ou, preferentiellement simple-brin) 
provenant d'un deuxieme echantillon biologique (figure 6). 

A la difference des variantes presentees precedemment, celle-ci 
n'utilise pas des heteroduplexes ou des heterotriplexes ADN/ARN mais des 

30 homoduplexes ADN/ADN. Cette variante est avantageuse puisqu'elle ne 
donne pas seulement acces aux exons et aux introns alternatifs mais 
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egalement, et a I'interieur d'une meme banque d'acides nucleiques, aux 
jonctions specifiques creees par deletion d-un exon ou d'un intron. De plus 
les sequences dans une telle banque donnent acces aux sequences 
flanquantes des exons et introns alternatifs. 
5 Pour les deux echantillons (i.e., conditions physiopathologiques) 

etudies, les- ARN cytosoliques polyA+ sont extraits selon les techniques 
connues de I'homme de metier et decrites precedemment. Ceux-ci sont 
convertis en ADNc par faction d'une transcriptase inverse depourvue ou non 
d'activite RNAse H intrinseque, comme decrit precedemment. L'un de ces 

10 ADNc simple brin est ensuite converti en ADNc double-brin par amorcage a 
I'aide d'hexameres aleatoires et selon les techniques connues de I'homme 
de Tart. Pour Tune des situations etudiees nous disposons done d'un ADNc 
simple-brin (appele "driver") et pour I'autre situation d'un ADNc double-brin 
(appele "tester'^.Xes-ADNc-sontdenafefes-pa^chauffage puis melanges de 

15 telle facon que le driver est en exces par rapport au tester. Cet exces est 
choisi entre 1 et 50 fois, avantageusement 10 fois. Dans une experience 
donnee, menee a partir de deux situations physiopathologiques, le choix de 
la situation qui donne le driver est arbitrage et ne doit pas influencer la nature 
des informations recueillies. En effet, comme dans le cas des approches 

20 precedemment presentees, la strategie d'identification des differences 
qualitatives qui existent entre deux populations d'ARNm repose sur le 
clonage de ces differences presentes dans des messagers communs : la 
strategie repose sur le clonage de sequences presentes au sein de duplex et 
non de simples brins correspondant a des sequences singulieres ou en 

25 exces dans I'une des situations etudiees. Le melange des populations 
d'ADNc est precipite puis repris dans une solution contenant du formamide 
(par exemple 80%). L'hybridation est menee de 16 heures a 48 heures, 
avantageusement 24 heures. Les produits de cette hybridation sont 
precipites puis soumis a Taction d'une endonuclease de restriction ayant un 

30 site de reconnaissance de I'ADN double-brin dicte par 4 bases. Une telle 
enzyme de restriction va done diver I'ADNc double brin forme lors de 



Best Available Copy 17 

I'hybridation en moyenne toutes les 256 bases. Cette enzyme est 
selectionnee avantageusement pour generer des sites cohesifs. - Des - 
exemples de telles enzymes sont foumis par des enzymes de restriction 
telles Sau3AI, Hpall, Taql et Msel. Sont done accessibles a une strategie de 
5 clonage utilisant les sites de restriction dives les fragments double-brin 
digeres par ces enzymes. Ces fragments sont de deux types : des fragments 
parfaitement hybrides, dont les deux brins sont parfaitement 
complementaires, et des fragments dont I'hybridation est partielle e'est a dire 
comprenant une boucle simple brin encadree par des regions double-brin 

10 (Figure 6A). Ces demiers fragments, minoritaires, contiennent les 
informations d'interet. Afin de les separer des fragments parfaitement 
hybrides, majoritaires puisque d6rives de la majorite de la longueur des 
ADNc, des techniques de separation sur gel ou sur toute autre matrice 

appropdee-sont- utilisees. Ces~techniques- mettent a profit— le - retard de 

15 migration, electrophoretique ou lors de gel filtration notamment, des 
fragments d'ADN qui contiennent une boucle d'ADN simple-brin. Ainsi les 
populations de fragments minoritaires qui contiennent les informations 
desirees peuvent etre separees de faoon preparative des populations de 
fragments majoritaires correspondant aux regions d'ADN identiques dans les 

20 deux populations. Cette variante, qui permet d'isoler au sein d'une m§me 
population les empreintes positives et negatives liees a des differences 
qualitatives, peut egalement etre appliquee a des heteroduplexes ARN/ADN. 
A cet egard, un exemple de retard de migration d'un heteroduplexe 
ARN/ADN dans lequel une partie de TARN n'est pas appariee, par rapport a 

25 un heteroduplexe homologue dans lequel toutes les sequences sont 
appariees est illustre sur le modele grb2/grb33 decrit dans les exemples (voir 
notamment la figure 8, puits 2 et 3). 



Identification et/ou Clonage 
30 A partir des populations d'acides nucleiques generees par 

hybridation, les regions caracteristiques des differences qualitatives (e.g., 
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des epissages. alternatifs differentiels) peuvent etre identifiees par toute 
technique connue de 1'homme du metier. 

Identification et/ou clonage a partir des heteroduplexes 

5 ARN/ADN 

Ainsi, dans le cas des heteroduplex ARN/ADN (premiere 
variante du precede), ces regions se presentent essentiellement sous forme 
de regions d'ARN non-appariees (boucles d'ARN), comme represents sur la 
Figure 3. Ces regions peuvent done etre identifiees et donees par separation 

10 des heteroduplexes, et des acides nucleiques simple-brin (ADN, ARN) 
(exces d'acide nucleique n'ayant pas reagi), digestion selective des ARN 
double-brins (domaines engages dans les heteroduplex), puis separation des 
ARN simple-brin resultant et des ADN simple-brins. 

A cet egard, selon une premiere-approche illustree-sur la Figure 

15 3, les regions d'ARN non appariees sont identifiees par traitement des 
heteroduplex au moyen d'une enzyme capable de digerer selectivement les 
domaines des ARN engages dans des heteroduplex ARN/ADN. Des 
enzymes douees de cette propriete sont decrites dans Tart anterieur et sont 
disponibles dans le commerce. Ce sont les RNases H, telles que en 

20 particulier, celle de E. Coli produite sous forme recombinante et disponible 
dans le commerce (Promega Ref. M4281 ; Life Technologies Ref. 18021). 
Ce premier traitement genere done un melange comprenant les regions 
d'ARN non appariees simple-brin et les ADNc simple-brin. Les ARNs peuvent 
etre separes des ADNc par toute technique connue de I'homme du metier, et 

25 notamment sur la base du marquage des amorces utilisees pour la 
preparation des ADNc (voir ci-dessus). Ces ARN peuvent §tre utilises 
comme source de materiel pour Tidentification de cibles, de produits 
genetiques d'interet ou toute autre application. Ces ARN peuvent egalement 
§tre convertis en ADNc, puis clones dans des vecteurs, comme decrit ci- 

30 apres. 

A cet egard, le clonage des ARNs peut etre realises de 
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differentes fa9ons. L'une consiste a inserer a chaque extremite des ARN des 
oligonucleotides servant de matrice a une reaction de transcription inverse 
en presence des amorces correspondantes. Cet ajout d'amorces se fait 
selon les techniques bien connues de rhomme du metier grace a une 

5 enzyme, telle que par exemple la ARN ligase qui provient du phage T4 et qui 
- catalyse la formation de liaisons phosphodiester intermoleculaires entre le 
phosphate en 5' d'une molecule donneuse et I'hydroxyl en 3' d'une molecule 
acceptrice. Une telle ARN ligase est disponible commercialement (par 
exemple Life Technologies - GIBCO BRL Ref. 18003). Les ADNc ainsi 

10 obtenus peuvent ensuite etre amplifies par les techniques classiques (PCR 
par exemple) en utilisant les amorces appropriees, comme illustre sur la 
Figure 3. Cette technique est particulierement adaptee au clonage des ARN 
de petite taille (inferieure a 1000 b). 

— U n e autre appr o ch e-pour -le clonage et/ou Identification des 

15 regions d'ARN specifiques consiste par exemple a realiser une transcription 
inverse, sur le produit de digestion par une enzyme specifique des ARN 
engages dans des double-brins, telle la Rnase H, en utilisant des amorces 
aleatoires, qui vont initier la transcription au hasard a I'interieur des ARNs. 
Les ADNc obtenus sont ensuite amplifies selon les techniques classiques de 

20 biologie moleculaire, par exemple par PCR en utilisant des amorces grace a 
des oligonucleotides ajoutes aux extremites des ADNc grace a Taction de 
TARN ligase du phage T4 (disponible commercialement ; par exemple chez 
Life Technologies - GIBCO BRL ref. 18003). Cette seconde technique est 
illustree sur la Figure 4 et dans les exemples. Cette technique est plus 

25 particulierement adaptee aux ARNs de taille importante, et permet d'obtenir 
une partie de ('information de sequence, suffisante pour reconstituer par la 
suite la totalite de la sequence de depart. 

Une autre approche pour le clonage et /ou ('identification des 
regions d'ARN specifiques repose egalement sur la realisation d'une 

30 transcription inverse en utilisant des amorces aleatoires (figure 4). 
Neanmoins, selon cette variante, les amorces utilisees sont au moins en 
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partie des amorces semi-aleatoires, c'est-a-dire des oligonucleotides 
. comprenant: 

- une region aleatoire (de degenerescence), 

- une zone minimale d'amorcage presentant un degre de 
5 contrainte defini, et 

- une zone stabilisatrice: 

De preference, il s'agit d'oligonucleotides comprenant, dans 
I'orientation 5' ->3' : . 

- une zone stabilisatrice comprenant 8 a 24 nucleotides 
o determines, de preference de 10 a 18 nucleotides. Cette zone stabilisatrice 

peut elle-meme correspondre a la sequence d'un oligonucleotide utilise pour 
reamplifier les fragments issus des premieres amplifications realisees a I'aide 
des amorces semialeatoires de I'invention. En outre, la zone stabilisatrice 

peut comp rendre la sequence d'un ou-plusieurs sites,- de preferen ce non — 

5 palindromiques, correspondent a des enzymes de restriction. Ceci permet 
par exemple de faciiiter le clonage des fragments ainsi amplifies. Un 
exemple particulier de zone stabilisatrice est represente par la sequence 
GAG AAG CGT TAT (residus 1 a 12 de SEQ ID NO:1); 

- une region aleatoire ayant de 3 a 8 nucleotides, plus 
o particulierement de 5 a 7 nucleotides, et 

- une zone minimale d'amorcage definie de sorte que 
I'oligonucleotide s'hybride en moyenne au moins toutes les 60 pb environ, de' 
preference toutes les 250 pb environ. Plus preferentiellement, la zone 
d'amorcage comporte de 2 a 4 nucleotides definis, preferentiellement 3 ou 4, 

5 tels que par exemple AGGX, ou X represente I'une des quatre bases A, C, G 
ou T. La presence d'une telle zone d'amorcage confere a I'oligonucleotide la 
capacite d'hybrider en moyenne toutes les 256 paires de bases environ. 

De maniere particulierement preferee, il s'agit 
d'oligonucleotides de formule : 

0 GAGAAGCGTTATNNNNNNNAGGX (SEQ ID NO: 1) ou les 

bases fixees ont ete ordonnees de fagon a minimiser le bruit de fond du a 
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des auto-appariements dans des experiences de PCR, ou N indique que les 
quatre bases peuvent etre pr^sentes de facon aleatoire a la position 
indiquee, et ou X represente Tune des bases A, C, G ou T. De tels 
oligonucleotides constituent egalement un objet de la presente invention. 
5 A cet egard, de facon a augmenter les possibilites d'amorcage 

sur les ARN a doner, des reactions en parallele peuvent etre effectuees 
avec des oligonucleotides tels que : 

GAGAAGCGTTATNNNNNNNAGGT (oligonucleotides A) 
GAGAAGCGTTATNNNNNNNAGGA (oligonucleotides B) 
io GAGAAGCGTTATNNNNNNNAGGC (oligonucleotides C) 

GAGAAGCGTTATNNNNNNNAGGG (oligonucleotides D), 
chaque population d'oligonucleotides (A, B, C, D) pouvant etre utilisee 
individuellement ou en combinaison avec une autre. 

Apres-lletape de transcription inverse, les ADNc sont amplifies- 

15 par PCR en utilisant les oligonucleotides A ou B ou C ou D. 

Comme indique ci-avant, selon la complexity et la specificite de 
la population des oligonucleotides souhaitee le nombre de positions 
degenerees peut varier de 3 a 8, de preference de 5 a 7. En deca de 3 les 
hybridations sont restreintes et au dela de 8 la population d'oligonucleotides 
20 est trop complexe pour assurer une bonne amplification de bandes 
specifiques. 

Par ailleurs, la longueur de I'extremite 3' fixe (la zone 
d'amorcage contrainte) de ces oligonucleotides peut egalement etre 
modifiee : si les amorces decrites plus haut, avec 4 bases fixees, permettent 

25 d'amplifier en moyenne des fragments de 256 paires de bases, des amorces 
avec 3 bases fixes permettent d'amplifier des fragments plus courts (64 
paires de bases en moyenne). Dans un premier mode prefere de I'invention, 
on utilise des oligonucleotides dans lesquels la zone d'amorcage comprend 4 
bases fixes. Dans un autre mode prefere de I'invention, on utilise des 

30 oligonucleotides ayant une zone d'amorcage de trois bases fixes. En effet, 
les exons ayant une taille moyenne de 137 bases, ceux-ci sont 
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avantageusement amplifies avec de tels oligonucleotides. A cet egard, voir 
egalement les oligonucleotides de sequence SEQ ID NO: 2, 3 et 4, par 
exemple. 

Enfin, generalement, Petape d'identification et/ou de clonage 
5 des ARN met en oeuvre les differentes methodes de PCR et de clonage, de 
maniere a obtenir 1'information la plus complete. 

. Identification et/ou clonage a partir des heterotriplexes. 

Dans le cas des heterotriplexes (autre variante du precede), les 

10 regions de differences qualitatives (insertions, deletions, epissages 
differentiels) se presentent essentiellement sous forme de regions d'ADN 
double-brin, comme represents sur la Figure 5. Ces regions peuvent done 
etre identifies et donees par traitement en presence d'enzymes appropriees 

telJes-quiuae-enzyme- permettant de- digerer- -les ARN* puis -une-erayme — 

15 permettant de dig6rer les ADN simple-brin. Les acides nucleiques ainsi 
obtenus sont done directement sous forme d'ADN double-brin et peuvent 
etre clones dans tout vecteur approprie, tel le vecteur pMos-Blue 
(Amersham, RPN 5110), par exemple. Cette methodologie est a differencier 
des approches deja decrites utilisant des ARNs ou oligonucleotides de 

20 sequences predeterminees, modifies pour exercer une activity nucleasique 
(Landgraf et al. (1994) Biochemistry, 33, 10607-10615). 



. Identification et/ou clonage a partir des homoduplexes 
ADN/ADN (figure 6). 

25 Les fragments isoles par leurs structures atypiques sont ensuite 

additionn^s, a chacune de leurs extr6mites, d'adaptateurs, ou linkers, ayant 
des sites de restriction dives a I'une de leurs extremites. Cette etape peut 
etre realisee selon les techniques connues de I'homme du metier, par 
exemple par ligation avec I'ADN ligase du phage T4. Les sites de restriction 

30 ainsi introduits sont choisis compatibles avec les sites des fragments 
d'ADNc. Les linkers introduits sont des sequences d'ADNc double-brin, de 
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sequences connues, permettant de deriver des amorces pour realiser des 
amplifications enzymatiques (PCR). Puisque I'etape suivante consiste a 
amplifier les deux brins qui presentent entre eux les differences qualitatives a 
identifier, il est necessaire d'utiliser des linkers dont les extremites 5' sont 

5 phosphorylees. Ainsi apres denaturation thermique des ADNc double-brin 
additionnes de linkers, chacune des extremites de ces ADNc est liee de 
facon covalente avec une sequence d'amorcage specifique. Apres PCR a 
I'aide des amorces specifiques appropriees, deux categories d'ADNc double- 
brin sont obtenues: des fragments qui contiennent des sequences 

10 specifiques de differences qualitatives qui distinguent les deux situations 
physiopathologiques, et des fragments qui comprennent I'empreinte negative 
de ces evenements d'epissages. Le clonage de ces fragments permet 
d'obtenir une banque d'epissages alternatifs dans iaquelle, pour chaque 

. evenement d'epissage, des empreintes — positives -et— negatives sont 

15 presentes. Dans cette banque, sont done accessibles non seulement les 
exons et les introns alternatifs mais aussi les jonctions specifiques creees 
par excision de ces sequences epissees. Dans une meme banque, ces 
differentes informations genetiques peuvent provenir des deux situations 
physiopathologiques sans discrimination. Par ailieurs, de facon a verifier le 

20 caractere differentiel des epissages identifies et de facon a determiner dans 
quelle situation ceux-ci sont specifiquement recrutes, les clones de la banque 
peuvent etre hybrides avec des sondes derivees de chacune des populations 
totales des ARNm. 

25 Deux usages principaux peuvent etre envisages pour les 

fragments d'ADNc issus des differences qualitatives identifies : 

- Leur clonage dans des vecteurs appropries de facon a 
constituer des banques representatives des differences qualitatives qui 
existent entre les deux situations physiopathologiques etudiees, 

30 - Leur utilisation en tant que sondes afin de cribler une banque 

d'ADN permettant d'identifier les evenements episses de facon differentielle. 
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Les vecteurs utilises dans I'invention peuvent etre notamment des 
plasmides, cosmides, phages, YAC, HAG, etc. Ces acides nucleiques 
peuvent ainsi etre conserves tels quels ou introduits dans des 
microorganismes adaptes au vecteur de clonage utilise, afin d'etre multiplies 
5 et/ou conserves sous forme de cultures. 

Les methodes telles que decrites ci-dessus sont generalement 
mises en oeuvre, pour chaque echantillon, sur une periode de temps de 
moins de deux mois, en particulier moins de 6 semaines. Par ailleurs, ces 
differentes methodes peuvent etre automatisees afin de reduire la duree 

10 totale et de faciliter le traitement de nombreux echantillons. 

A cet egard, un autre objet de I'invention concerne les acides 
nucleiques identifies et/ou clones par les methodes de I'invention. Comme 
indiqu6 ci-dessus, ces acides nucleiques peuvent etre des ARN ou des 
ADNc. - Plus generalement, -Unventba-conGefne- une composition d'acides 

15 nucleiques, comprenant essentiellement des acides nucleiques 
correspondant aux epissages altematifs distinguant deux situations 
physiologiques. Plus particulierement, ces acides nucleiques correspondent 
aux epissages altematifs identifies dans un echantillon biologique test et non 
presents dans le meme echantillon biologique dans une situation de 

20 reference. L'invention a egalement pour objet I'utilisation des acides 
nucleiques ainsi clones comme produit therapeutique ou diagnostic, ou 
comme outil de criblage de molecules actives, comme indique ci-apres. 

Les differentes methodes exposees ci-dessus aboutissent done 
toutes au clonage de sequences d'ADNc qui represented I'information 

25 genetique epissee differentiellement entre deux situations 
physiopathologiques. L'ensemble des clones issus de I'une de ces methodes 
permet done la constitution d'une banque representative des differences 
qualitatives qui existent entre deux situations etudiees. 



30 



Generation de banques qualitatives 

A cet egard, I'invention concerne en outre un procede de 
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preparation d'une banque d'acides nucleiques representatifs d'un etat 
physiologique donne d'un echantillon biologique. Ce precede comprend 
avantageusement le clonage d'acides nucleiques representatifs des 
marqueurs qualitatifs d'expression genetiques (par exempie des epissages 
5 alternatifs) dudit etat physiologique et non presents dans un etat de 
reference, dans des banques specifiques de differences qualitatives qui 
existent entre les 2 etats etudies. 

Ces banques sont constitutes d'ADNc inseres dans des 
vecteurs plasmidiques ou phagiques. Ces banques peuvent etre presentees 

10 sur des filtres de nitrocellulose ou tout autre support connu de Phomme de 
i'art, tels des chips ou biopuces. 

L'une des caracteristiques et en meme temps I'une des 
originates du criblage differential qualitatif est que cette technique aboutit a 
non pas une -mais— avantageusement deux banques differentielles -qyi— 

15 represented I'ensemble des differences qualitatives qui existent entre deux 
situations donnees : Paire de banque (voir figure 1D). 

Ainsi, I'invention concerne de preference toute composition ou 
banque d'acides nucleiques, susceptible d'etre obtenue par hybridation entre 
une population d'ARN provenant d'un premier echantillon biologique et une 

20 population d'ADNc provenant d'un deuxieme echantillon biologique. Plus 
preferentiellement, les banques ou compositions de ('invention comprennent 
des acides nucleiques representatifs des differences qualitatives 
d'expression entre deux echantillons biologiques, et sont produites par un 
procede comprenant (i) une etape au moins d'hybridation entre une 

25 population d'ARN provenant d'un premier echantillon biologique et une 
population d'ADNc provenant d'un deuxieme echantillon biologique, (ii) la 
selection des acides nucleiques representatifs des differences qualitatives 
d'expression et, eventuellement (iii) le clonage desdits acides nucleiques. 

En outre, apres constitution de telles banques, il est possible 

30 d'effectuer une etape de selection des clones pour ameliorer la specificite 
des banques obtenues. En effet, il est possible que certains 
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mesappariements observes ne soient pas uniquement dus a differences 
qualitatives (e.g. a des epissages alternatifs differentiels), mais puissent 
resulter de defaut(s) de la transcription inverse par exemple. Bien que ces 
evenements ne soient pas generalement significatrfs, il est preferable de les 
5 eliminer ou de les reduire prealablement au clonage des acides nucleiques. 
Pour ce faire, les clones de la banque peuvent etre hybrides avec les 
populations d'ADNc des deux situations physiologiques etudiees (voir etape 
(c) ci-dessus). Les clones hybridant de facon non differentielle avec les deux 
populations peuvent etre consideres comme non-specifiques et 

io eventuellement eiimines ou traites en deuxieme priorite (en effet, I'apparition 
d'une nouvelle isoforme dans I'echantillon test ne signifie pas toujours que 
I'isoforme initiale presente dans I'echantillon de reference a disparu de cet 
echantilion test). Les clones n'hybridant qu'avec une seule des deux 
populations ou hybridant- de-facon-preferentieUe avec I'une des populations 

15 sont consideres comme specifiques et peuvent etre selectionnes en premiere 
priorite pour constituer des banques enrichies ou affinees. 

Un affinage peut egalement etre realise par hybridation et 
validation de clones avec des sondes provenant d'un nombre statistiquement 
relevant d'echantillons pathologiques. 

20 La presente demande a done egalement pour objet toute 

banque d'acides nucleiques comprenant des acides nucleiques specifiques 
d'epissages alternatifs caracteristiques d'une situation physiologique. Ces 
banques sont avantageusement constitutes d'ADNc, generalement double 
brin, correspondant aux regions d'ARN specifiques d'un epissage alternatif. 

25 Ces banques peuvent etre constitutes des acides nucleiques, generalement 
dans un vecteur de clonage ou de cultures cellulaires contenant lesdits 
acides nucleiques. 

Le choix des ARN de depart determine en partie les 
caracteristiques des banques obtenues : 

30 - les ARN des deux situations A et B sont des ARNm ou des 

ARN totaux matures isoles selon les techniques connues de I'homme de Part. 
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Les banques sont alors des banques de criblage differentiel qualitatif dltes 
restreintes, car restreintes aux differences qualitatives qui caracterisent les 
ARN matures des deux situations physiopathologiques. 

- Les ARN de Tune des situations sont des ARNm ou totaux 
5 matures alors que les ARN de I'autre situation sont des ARN premessagers, 
non matures par epissage, isoles selon les techniques connues de I'homme 
de Tart, a partir de noyaux cellulaires. Dans ce cas les banques obtenues 
sont des banques de criblage differentiel dites complexes, puisque non 
restreintes aux differences entre ARN matures mais comprenant tout le 

10 repertoire des epissages transcrits dans une situation et elimines dans 
I'autre, dont tous les introns. 

enfin, les ARN peuvent provenir d'une seule situation 
physiopathologique et dans ce cas le criblage differentiel implique les ARN 
— m atures et les-preroessagers d'un meme echantillon. Dans ce-casr-les- 

15 banques obtenues sont des banques de criblage differentiel qualitatif 
autologues. L'interet de telles banques est qu'elles rassemblent 
exclusivement le repertoire des introns transcrits dans une situation donnee. 
Leur hybridation avec une sonde provenant d'ARN matures d'une autre 
situation determine rapidement si a cette situation est caracterisee par une 

20 retention d'introns tout en permettant aisement leur identification. 

Generalement, les banques sont generees par etalement, sur 
milieu solide (notamment sur milieu gelose), d'une culture cellulaire 
transformee par les acides nucleiques clones. La transformation est realisee 
par toute technique connue de I'homme du metier (transfection, phosphate 

25 de calcium, electroporation, infection par des bacteriophages, etc). La culture 
cellulaire est generalement une culture de bacteries, telles que par exemple 
les bacteries E. coli. II peut egalement s'agir de cultures de cellules 
eucaryotes, notamment de cellules eucaryotes inferieures (levures par 
exemple). Cet etalement peut etre realise sur boite ou sur tout autre support 

30 adapte, en conditions steriles. En outre, ces cultures etalees en milieu gelose 
peuvent etre stockees sous forme congelee par exemple (dans du glycerol 
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ou autre agent adapte). Ces banques peuvent naturellement etre utilisees 
pour la production de "repliques", c'est-a-dire de copies selon les techniques - 
habituelles detaillees ci-apres. En outre, ces banques servent generalement 
a preparer une banque ampiifiee, c'est-a-dire une banque comprenant 
5 chaque clone sous forme ampiifiee. Une banque ampiifiee est preparee 
comme suit- : -a- partir de la culture etalee, tous les clones cellulaires sont 
recuperes et sont conditionnes pour etre conserves sous forme cOngelee ou 
au froid, dans tout milieu adapte. Cette banque ampiifiee est 
avantageusement realisee a partir de cultures de bacteries E.coli, et 

10 conservee a 4°C, en conditions steriles. Cette banque ampiifiee permet la 
preparation et la reproduction illimitee de toute banque ulterieure contenant 
ces clones, sur differents supports, pour differentes applications. Une telle 
banque permet en outre Pisolement et la caracterisation de tout clone 
d'interet. Chacun des_clones .constituanLJes-banques de I'invention est en 

15 effet un element caracteristique d'une situation physiologique, et constitue 
done une cible particulierement interessante pour differentes etudes telles 
que la recherche de marqueurs, la preparation d'anticorps, le diagnostic, le 
traitement pour transfer! de genes, etc. Ces differentes applications sont 
discutees plus en detail plus loin. La banque est generalement preparee 

20 comme decrit ci-dessus par etalement des cultures dans un milieu gelose, 
sur un support adapte (boite de petri par exemple). L'interet d'utiliser un 
milieu gelose est que chaque colonie peut etre separee et individualisee. A 
partir de cette culture, des repliques a I'identique peuvent etre preparees en 
quantites importantes par simple "replique" sur tout support approprie selon 

25 les techniques de I'homme de Tart. Ainsi, la replique peut etre realisee au 
moyen de filtres, membranes (nylon, nitrocellulose, etc) permettant 
I'accrochage des cultures. Les filtres peuvent ensuite etre stockes en I'etat, a 
4 6 C par exemple, sous forme dessechee, dans tout type de conditionnement 
qui n'altere pas les acides nucleiques. Les filtres peuvent egalement etre 

30 traites de maniere a eliminer les cellules, proteines, etc, et a ne conserver 
que des composants tels que les acides nucleiques. Ces traitement peuvent 
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comprendre notamment des proteases, des d&ergents, etc. Les fittres traites 
peuvent egalement etre conserves . dans tout dispositif ou toute condition 
adaptes aux acides nucieiques. 

Les banques d'acides nucieiques peuvent egalement etre 
5 preparees directement a partir des acides nucieiques, par depot sur des 
biopuces ou tout autre dispositif approprie. 

L'invention concerne egalement toute banque comprenant des 
oligonucleotides specifiques d'epissages alternatifs distinguant deux 
situations physiologiques. II s'agit avantageusement d'oligonucleotides 
10 simple-brin, comprenant de 5 a 100-meres, de preference moins de 50- 
meres, par exemple autour de 25-meres environ. 

Ces oligonucleotides sont specifiques d'epissages alternatifs 
representatifs d'une situation ou d'un type de situation physiologique. Ainsi, 
de tels oligonucleotides peuvent etre-par^-exemple-4es~oligonucleotides 
15 representatifs d'evenements d'epissages alternatifs caracteristiques de 
situations d'apoptose. II a en effet ete decrit dans la Iitt6rature que certains 
epissages alternatifs etaient observes dans le cadre de situations 
apoptotiques. II s'agit par exemple d'epissages dans les genes Bclx, Bax, 
Fas ou Grb2 notamment. A partir des donnees publiees et des sequences 
20 accessibles dans la litterature et/ou sur bases de donnees, il est possible de 
creer des oligonucleotides specifiques des formes epissees et non epissees. 
Ces oligonucleotides peuvent par exemple etre crees selon la strategie 
suivante : 

(a) identification d'une proteine ou d'un evenement d'epissage 
25 caracteristique d'une situation d'apoptose et de la sequence du doniaine 

episse. Cette identification peut etre basee sur des donnees publiees ou par 
compilation de sequences accessibles sur bases de donnees; 

(b) synthese artificielle d'un ou plusieurs oligonucleotides 
correspondent a une ou plusieurs regions de ce domaine, qui permettent 

30 done par hybridation de mettre en evidence la forme non epissee dans les 
ARN d'un echantillon test; 
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(c) synthase artificielie d'un ou plusieurs oligonucleotides 
correspondant a la region-de jonction entre ies deux domaines separes par 
le domaine episse. Ces oligonucleotides pennettent done par hybridation de 
mettre en evidence la forme epissee dans Ies ARN d'un echantillon test; 
5 (d) reproduction des etapes (a) a (c) ci-dessus avec d'autres 

proteines ou evenements d'epissages caracteristiques d'une situation 
d'apoptose; 

(e) transfert sur un premier support approprie du ou des 
oligonucleotides specifiques des formes apoptotiques des messagers 

10 identifies ci-avant et, sur un autre support approprie, du ou des 
oligonucleotides specifiques des formes non-apoptotiques. 

Les deux supports ainsi obtenus peuvent etre utilises pour 
tester I'etat physiologique de cellules ou echantillons tests, et notamment leur 
etat apopt otique, par hy bridation- d?une preparation d'acides nucleiques de 

15 ces cellules ou echantillons. 

D'autres banques similaires peuvent etre generees avec des 
oligonucleotides specifiques d'etats physiopathologiques differents 
(neurodegenerescence, toxicite, proliferation, etc.) et ainsi permettre un 
elargissement des domaines d'applications. 

20 Des banques d'introns ou d'exons altematifs peuvent aussi etre 

des banques de donnees informatiques constitutes par analyse 
systematique des banques de donnees qui regroupent les informations 
relatives au genome de tel ou tel organisme, tissu ou culture cellulaire. Dans 
ce cas, les donnees obtenues par constitution de telles banques virtuelles 

25 peuvent etre utilisees pour generer des amorces oligonucleotidiques qui 
seront utilisees pour tester en parallele deux situations physiopathologiques. 

Les donnees des banques informatiques peuvent egalement 
etre utilisees pour deriver des sondes nucleotidiques generates, 
representatives d'une classe de proteines ou encore specifiques d'une 

30 sequence definie. Ces sondes peuvent ensuite etre appliquees sur les 
banques de clones issues des differentes techniques de clonage des introns 
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et exons alternatifs afin d'obtenir une image de la complexite de ces banques 

— moleculaires et de determiner rapidement si telle ou telle classe de proteines 
ou telle ou telle sequence determinee est epissee differentiellement entre 
deux etats physiopathologiques distincts. 
5 Une autre banque ou compositions d'acides nucleiques selon 

I'invention est une banque antisens, realisee a partir des sequences 
identifies selon les methodes de I'invention (DATAS). Pour la realisation de 
ce type de banques, ces sequences sont donees de facon a etre exprimees 
en fragments d'ARN correspondant a une orientation antisens par rapport 

10 aux ARN messagers sur lesquels ont ete realises DATAS. On aboutit ainsi a 
une banque dite antisens. Cette approche utilise de preference la variante de 
clonage qui permet une orientation des fragments clones. L'interet d'une telle 
banque antisens est de permettre la transfection de lignees cellulaires et de 
suivre—l'-alteration de tout phenotype qu'il soit d'ordre - morphotegique v - 

15 enzymatique ou suivi par ('utilisation de genes rapporteurs ou de resistance a 
un agent de selection. L'analyse des variations phenotypiques consecutives 
a I'introduction d'un vecteur d'expression antisens se fait generalement apres 
selection de clones dits stables, c'est a dire permettant une replication 
coordonnee du vecteur d'expression et du genome . de I'hote. Cette 

20 coordination est permise par I'integration du vecteur d'expression dans le 
genome cellulaire ou, lorsque le vecteur d'expression est episomal, par 
pression de selection. Cette pression de selection se fait par traitement de la 
culture cellulaire transferee avec un agent toxique qui ne peut etre detoxifie 
que lorsque le produit d'un gene porte par le vecteur d'expression est 

25 exprime dans la cellule. II s'ensuit une synchronisation entre la replication de 
I'h6te et celle du transgene. Avantageusement, on utilise des vecteurs 
episomaux derives du virus Epstein-Barr qui permettent I'expression dans 
une meme cellule de 50 a 100 copies du vecteur (Deiss et al, 1996, EMBO 
J., 15, 3861-3870 ; Kissil et al, 1995, J. Biol. Chem, 270, 27932-27936). 

30 L'interet de ces banques antisens aliiees aux sequences 

DATAS qu'elles contiennent est d'identifier non seulement quel gene a eu 
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son expression inhib§e pour amener au phenotype s61ectionn6 mais aussi 
d'identifier quelle isoforme d'epissage de ce gene a ete affectee. Lorsque le 
fragment antisens cible un exon donne, il peut en etre d6duit que le domaine 
proteique et done la fonction impliquant ce domaine s'oppose au phenotype 
observe. En cela le couplage de DATAS avec une approche antisens 
repr6sente un raccourci vers la genomique fonctionnelle. 

Puces a ADN 

L'invention concerne egalement tout support (membrane, filtre, 
biopuce, chip, etc) comprenant une banque ou une composition d'acides 
nucleiques telle que definie ci-dessus. II peut s'agir plus particulierement 
d'une banque cellulaire ou d'une banque d'acides nucleiques. L'invention 
concerne egalement tout kit ou support comprenant plusieurs banques selon 
l'inventian.-En particulieMl-peuLetre-avantageux d'utiliser en parallele une 
banque representative des qualites d'un etat physiologique test par rapport a 
un etat physiologique de reference et, a titre de controle, une banque 
representative des qualites de I'etat physiologique de reference par rapport a 
I'etat physiologique test ("paire de banques"). Un kit avantageux selon 
l'invention comprend done deux banques qualitatives differentielles de deux 
situations physiologiques (une "paire de banques"). Selon un mode de 
realisation particulier, les kits de l'invention comprennent plusieurs paires de 
banques telies que definies ci-dessus, correspondant a differents etats 
physiologiques ou a differents echantillons biologiques par exemple. Les kits 
peuvent comprendre par exemple ces differentes paires de banques 
deposees en serie sur un meme support. 

Generation de sondes 

Une autre utilisation des compositions d'ADNc selon l'invention, 
representatifs des differences qualitatives qui existent entre deux etats 
physiopathologiques, consiste a en deliver des sondes. De telies sondes 
peuvent en effet etre utilisees pour cribler les evenements episses de facon 
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differentielle entre deux situations physiopathologiques. 

. ~- Ces sondes (voir figure 1D) peuvent etre preparees par marquage des - 

populations ou banques d'acides nucleiques selon les techniques 
classiques, connues de rhomme du metier. Ainsi, il peut s'agir de marquage 
5 ' enzymatique, radioactif, fluorescent, immunologique, etc. Preferentiellement, 
il s'agit d'un marquage radioactif ou fluorescent. Ce type de marquage peut 
etre realise par exemple en introduisant sur la population d'acides 
nucleiques (soit apres synthese soit au cours de leur synthese) des 
nucleotides marques, permettant leur revelation par les methodes 

10 conventionnelles. 

Une application est done de cribler une banque genomique 
classique. Une telle banque peut comprendre selon le vecteur, derive d'un 
phage ou d'un cosmide, des fragments d'ADN de 10kb a 40kb. Le nombre 

de-clones-hybridant avec les sondes generees par DATAS-et representatife 

15 des differences d'epissage qui existent entre deux situations reflete done a 
peu pres le nombre de genes affectes par des variations d'epissage, selon 
qu'ils sont exprimes dans I'une ou I'autre des situations etudiees. 

De preference, les sondes de I'invention sont utilisees pour 
cribler une banque d'ADN genomique (generalement humaine) adaptee a 

20 Identification d'evenements d'epissage. De preference, une telle banque 
genomique est composee de fragments d'ADN de taille restreinte 
(generalement clones dans des vecteurs), de facon a statistiquement ne 
recouvrir qu'un seul element epissable differentiellement, e'est a dire un seul 
exon ou un seul intron. La banque d'ADN genomique est done preparee par 

25 digestion d'ADN genomique avec une enzyme ayant un site de 
reconnaissance restreint par 4 bases, assurant ainsi la possibility d'obtenir 
par digestion menagee des fragments d'ADN de taille moyenne de 1 kb. De 
tels fragments necessitent I'obtention de 10 7 clones pour constituer une 
banque d'ADN representative d'un genome d'organisme eucaryote 

30 superieur. Une telle banque constitue egalement un objet de la presente 
demande. Cette banque est ensuite hybridee avec les sondes derivees du 
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criblage differentiel qualitatif. Precisement, de chaque experimentation 
... — consideree et qui compare deux situations physiopathologiques A et-B-deux 
sondes (paire de sondes) sont obtenues. Une sonde enrichie en 
evenements d'epissages caracteristiques de la situation A et une sonde 
5 enrichie en marqueurs d'6pissage de B. Les clones de la banque genomique 
qui hybrident preferentiellement avec Tune ou I'autre sonde portent des 
sequences preferentiellement epissees dans les situations 
physiopathologiques correspondantes. 

Les methodes de l'invention permettent ainsi 1'identification 
10 systematique de differences qualitatives d'expression genique. Ces 
methodes presentent de nombreuses applications, dans 1'identification et/ou 
le clonage de molecules d'interet, en toxicologie, en pharmacologie ou 
encore en pharmacogenomique par exemple. 



15 Applications 

L'invention concerne done egalement ('utilisation des methodes, 
acides nucleiques ou banques decrite ci-dessus pour I'identification de 
molecules d'interet therapeutique ou diagnostique. L'invention concerne plus 
particulierement ('utilisation des methodes, acides nucleiques ou banques 

20 decrite ci-dessus pour I'identification de proteines ou domaines prot6iques 
affectes dans une pathologie. 

L'un des atouts de ces techniques est en effet d'identifier a 
I'interieur d'un messager, et par consequent de la proteine correspondante, 
les domaines fonctionnels qui sont affectes dans une pathologie donnee. 

25 Cela permet d'assigner a un domaine donne une importance dans le 
developpement ou le maintien d'un etat pathologique. L'avantage immediat 
de restreindre a un domaine precis d'une proteine I'impact d'une deregulation 
pathologique est de proposer celui-ci comme une cible relevante pour un 
criblage de petites molecules a visee therapeutique. Ces. informations 

30 constituent egalement des clefs qui permettent de concevoir des 
polypeptides a activite therapeutique delivrables par therapie genique; Ces 
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polypeptides peuvent notamment etre des anticorps simples chaTnes derives 
d'anticorps. neutralisants diriges contre les domaines identifies par les 
techniques decrites ci avant. 

Plus specifiquement, les methodes selon rinvention permettent 
5 d'obtenir des molecules qui peuvent: 

--etre des sequences codantes qui derivent d'exons altematifs. 

- correspondre a des sequences non codantes portees par des 
introns episses differentiellement d'un etat physiopathologique a un autre. 

De ces deux points, differents enseignements peuvent etre 

o tires. 

Les Spissages altematifs d'exons qui differencient deux etats 
physiopathologiques traduisent un niveau de regulation de I'expression 
genetique qui permet de moduler ( plus precisement d'abolir ou d'instaurer) 
une ou plusieurs-fonctions -tfune-prjoteine-donnee. Ainsi la plupart des 
5 domaines structuraux et fonctionnels (SH2, SH3, PTB, PDZ, et les domaines 
catalytiques de differentes enzymes...) etant codes par plusieurs exons 
contigus, deux configurations peuvent se presenter : 

i) Les domaines sont tronques dans la situation 
pathologique (Zhu, Q. et al, 1994, J. Exp. Med., vol 180, n°2, pp461-470); 

o cela indique que les chemins de signalisation impliquant ces domaines 
doivent etre restaures dans un but therapeutique. 

ii) Les domaines sont maintenus au cours d'une 
pathologie alors qu'ils sont absents dans une situation saine; ces domaines 
peuvent etre consideres comme des cibles de criblage de petites molecules 

5 chimiques destinees a antagoniser les signaux transduits par I'intermediaire 

de ces domaines. 

Les sequences epissees differentiellement peuvent 

correspondre a des regions non-codantes situees en 5' ou en 3' de la 

sequence codante ou a des introns intervenant entre deux exons codants. 
o Dans les regions non codantes, ces epissages differentiels peuvent traduire 

une modification de la stability ou de la traductibilite du messager (Bloom, T. 
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J., and Beavo, J. A., 1995, Proc. Natl. Acad. Sci. USA, vo!93, n° 24, pp 
14188-14192; Ambartsumian,-N. et al., 1995, Gene, vol 159, n° 1, pp 125- 
130). Ces phenbmenes doivent alors etre recherches sur ia base de ces 
informations et peuvent mettre en evidence que Paccumulation ou la 

5 disparition de ia proteine correspondante la designe ainsi comme cible 
— — d'interet. Lorsque la retention d'un intron se produit dans une sequence 
codante, il s'ensuit le plus souvent une troncature de la proteine naturelle par 
introduction de codon stop dans la phase de lecture (Varesco, L, et al, 1994, 
Hum. Genet., vol 93, n°3, pp281-286; Canton, H., et al., 1996, Mol. 

10 Pharmacol., vol 50, n° 4, pp799-807, Ion, A., et al, 1996, Am. J. Hum. 
Genet., vol 58, n°6, ppl 185-1 191). Avant de rencontrer ce codon stop, il se 
produit generalement une lecture de quelques codons supplementaires, ce 
qui aboutit a adjoindre a la partie deja traduite une sequence specifique, 
_temoin. -pxoteique — de — I'epissage- - alternatif. Ces acides -amines 

15 supplementaires peuvent etre utilises pour generer des anticorps specifiques 
de la forme alternative caracteristique de la situation pathologique. Ces 
anticorps peuvent etre ensuite utilises comme outils de diagnostic. La 
proteine tronquee voit ses proprietes modifiees, voire alterees. Ainsi des 
enzymes peuvent etre amputees de leur domaine catalytique ou de leur 

20 domaine regulateur, devenant inactives ou constitutivement activees. Des 
adaptateurs peuvent perdre leur capacite a connecter differents partenaires 
d 'une cascade de signalisation(Watanabe, K. et al, 1995, J. Biol. Chem., vol 
270, n°23, pp1 3733-1 3739). Les produits d'epissage des recepteurs peuvent 
aboutir a des recepteurs qui ont perdu leur capacite a Her leur ligand 

25 (Nakajima, T. et al, 1996, Life Sci., vol58, n°9, pp761-768) et peuvent 
egalement generer des formes de recepteurs solubles par relargage de leur 
domaine extracellulaire (Cheng J., 1994, Science, vol263, n° 5154, pp1759- 
1 762). Dans ce cas, des tests diagnostiques peuvent etre envisages, bases 
sur la circulation dans les differents fluides physiologiques de forme soluble 

30 de recepteur a un ligand donne. 

L'invention conceme plus particulierement I'utilisation des 
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methodes, acides nucleiques ou banques decrits ci-dessus pour 
('identification de domaines antigeniques specifiques de proteines impliquees 
dans une pathologie. L'invention conceme egalement I'utilisation des acides 
nucleiques, proteines ou peptides tels que decrits ci-avant pour le diagnostic 
5 de pathologies. 

— L'invention concerne egalement une methode d'identification 

et/ou de production de proteines ou domaines proteiques impliques dans une 
pathologie comprenant : 

(a) I'hybridation des ARN messagers d'un echantillon 
10 pathologique avec les ADNc d'un echantillon sain, ou I'inverse, ou les deux 

en parallele, 

(b) Tidentification, dans les hybrides formes, des regions 
correspondant aux differences qualitatives (non appariees (ARN) ou 

- appariees_(ADN doubJeJarir^jr^p ec ifi ques de I'etat pathologique par rapport- 

15 a I'etat sain, 

(c) Tidentification et/ou la production de la proteine ou domaine 
proteique correspondant a une ou plusieurs regions identifiees en (b). 

Les regions identifiees correspondent generalement a des 
epissages differentiels, mais il peut egalement s'agir d'autres alterations 
20 genetiques telles que insertion(s) ou deletion(s), par exemple. 

La ou les proteines ou domaines proteiques peuvent etre isoles, 
sequences, et utilises dans des applications therapeutiques ou 
diagnostiques, notamment pour la preparation d'anticorps. 

A titre d'exemple plus specifique, le criblage differentiel qualitatif 
25 de l'invention permet avantageusement de mettre en evidence des genes 
suppresseurs de tumeurs. En effet, de nombreux exemples indiquent que 
Tun des modes deactivation des genes suppresseurs au cours de la 
progression tumorale est une inactivation par modulation de Tepissage de 
formes alternatives. 

30 Ainsi, dans les carcinomes pulmonaires a petites cellules, le 

gene de la proteine p130 qui appartient a la famille RB (proteine du 
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retinoblastoma) est mute a un site consensus d'epissage. La consequence 
de cette mutation est I'elimination de I'exon 2 et une non synthese de 
proteine due a la presence d'un codon stop precoce. Cette observation a ete 
la premiere a souligner ('importance des membres de la familie RB dans la 
5 tumorigenese. De meme, dans certains cancers du poumon non a petites 
cellules, le gene de la proteine p16INK4A, proteine qui est un inhibiteur des 
kinases cyclines-dependantes cdk4 et cdk6 est mute dans un site donneur 
d'epissage. Le resultat de cette mutation est la production d'une proteine 
tronquee a demi-vie courte ce qui a pour consequence Paccumulation des 

10 formes phosphorylees, inactives, de RB. Par ailleurs, WT1, le gene 
suppresseur de tumeur de Wilms, est transcrit en plusieurs ARN messagers 
generes par epissages altematifs. Dans les cancers du sein, les proportions 
relatives des differents variants sont modifiees par rapport au tissu sain, 

— -joum is sa nt de s nuti l s diagnostics et des pistes pour comprendre im portanc e 

15 des differents domaines fonctionnels de WT1 dans la progression tumorale. 
Ce meme phenomene de modification des rapports entre differentes formes 
d'ARN messagers et d'isoformes proteiques lors de la transformation 
cellulaire est retrouve pour la neurofibrine NF1. En outre, cette notion de 
modulation des phenomenes d'epissage qui signe la progression tumorale 

20 est soutenue egalement par I'exemple de HDM2 dont 5 epissages altematifs 
sont detectes dans les carcinomes ovariens et pancreatiques et dont les 
expressions augmentent selon le stade d'avancement tumoral. D'autre part, 
dans les cancers de la tete et du cou, I'un des mecanismes deactivation de 
p53 implique une mutation dans un site consensus d'epissage. 

25 Ces quelques exemples listes illustrent tout I'intenM des 

techniques de ('invention basees sur la recherche systematique des 
variations d'epissage qui distinguent une tumeur donnee du tissu sain voisin. 
Les resultats qui en decoulent permettent en effet non seulement la 
caracterisation de genes suppresseurs de tumeurs deja connus mais 

30 egalement, compte tenu de I'aspect original et systematique des techniques 
de criblage differentiel qualitatif, Tidentification de nouvelles variations 
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d'epissages specifiques de tumeurs affectant vraisemblablement de 
nouveaux genes suppresseurs de tumeurs. 

L'invention a done egalement pour objet un procede 
d'identiflcation et/ou de clonage de genes suppresseurs de tumeurs ou 
5' d'alterations genetiques (e.g., d'epissages) au sein de genes suppresseurs 
de tumeurs, tel que defini ci-avant. ee procede peut avantageusement 
comprendre les etapes suivantes : 

(a) I'hybridation des ARN messagers d'un echantillon de tumeur 
avec les ADNc d'un echantillon sain, ou I'inverse, ou les deux en parallele, 
10 (b) I'identification, dans les hybrides formes, des regions 

specifiques de I'echantillon tumoral par rapport a I'etat sain, 

(c) I'identification et/ou le clonage de la proteine ou domaine 
proteique correspondant a une ou plusieurs regions identifies en (b). 

Les proprietes suppresseu^ de tumeur des proteines ou 

15 domaines identifies peuvent ensuite §tre testees dans dHTerents modeles 
connus. Ces proteines, ou leur forme native (possedant I'epissage observe 
dans le tissu sain), peuvent ensuite etre utilisees dans des applications 
therapeutiques ou diagnostiques, notamment en therapie genique 
antitu morale. 

20 La presente demande a done egalement pour objet non 

seulement les differents aspects de mise en oeuvre de la technologie mais 
aussi ('exploitation des informations qui en decoulent a des fins de 
recherche, de developpement de criblage de petites molecules chimiques, de 
developpement d'outils de therapie genique ou de diagnostic. 

25 A ce titre, l'invention concerne egalement I'utilisation des 

methodes, acides nucleiques ou banques decrits ci-dessus en 
genotoxicologie, e'est-a-dire pour anticiper (predire) le potentiel toxique de 
composes tests. 

Les programmes genetiques engages lors du traitement de 

30 cellules ou de tissus par des agents toxiques sont en grande partie correles 
aux phenomenes d'apoptose ou mort cellulaire programmee. L'importance 
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des phenomenes d'epissage alternatif dans ia regulation de ces voies 
apoptotiques est bien illustree par la litterature. Cependant, aucune - 
technologie genomique decrite jusqu'a present ne permettait de rechercher 
systematiquement et d'isoler de maniere exhaustive les variations de 

5 sequences dues a des epissages alternates et distinguant deux situations 
physiopathologiques donnees. Les techniques de criblage differentiel 
qualitatif d6veloppees dans la presente invention permettent de regrouper 
I'ensemble des differences d'epissage qui existent entre deux situations dans 
des banques d'ADNc. La comparaison des sequences d'ARN (par exemple 

10 les ARN messagers) d'un tissu (ou d'une culture cellulaire) tra'ite ou non avec 
un compose toxique de reference permet d'etablir des banques d'ADNc qui 
regroupent les differences qualitatives de I'expression genique qui 
caracterisent Taction toxique etudiee. Ces banques d'ADNc peuvent ensuite 

eice-bydridees-avec des sondes derivees d'ARN extrait des-memes 4issus-ou 

15 cellules traites avec un produit chimique dont on veut evaluer le potentiel 
toxique. La plus ou moins grande capacite de ces sondes a s'hybrider avec 
les informations genetiques specifiques d'une situation toxique de reference 
permet de lui assigner un potentiel toxique. Par ailleurs, outre I'application de 
DATAS a la generation et I'utilisation de banques de differences qualitatives 

20 induites par des agents toxiques, une partie de invention consiste 
egalement a demontrer que des deregulations dans I'epissage de certains 
ARNs messagers peuvent etre induites par certains agents toxiques, a des 
doses inferieures aux IC50 mesurees dans des tests de cytotoxicite et 
d'apoptose connus de I'homme de Part. De telles deregulations (ou 

23 dysregulations) peuvent etre utilisees comme marqueurs pour le suivi de la 
toxicite et/ou de I'efficacite de molecules (chimiques ou genetiques). 

L'invention conceme done egalement toute methode de 
detection ou de suivi du potentiel toxique et/ou therapeutique d'un compose 
basee sur la detection de formes et/ou de profils d'epissages induits par ce 

30 compose sur un 6chantillon biologique. Elle concerne en outre I'utilisation de 
toute modification de formes et/ou de profils d'epissages comme marqueur 
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pour le suivi de la toxicite et/ou de I'efficacite de molecules. 

devaluation ou le suivi. du potentiel toxique peut s'effectuer plus 
particulierement selon deux approches : 

Selon la premiere approche, le criblage differentiel qualitatif 
5 peut etre realise entre un tissu ou une culture cellulaire de reference, d'une 
part non traite et d'autre part traite par le produit dont on veut evaluer la 
toxicite. L'analyse des clones qui represented les differences qualitatives 
specifiquement induites par le produit permet ensuite eventuellement de 
detecter dans ces clones des evenements caracteristiques d'ADNc impliques 
10 dans les phenomenes lies a la toxicite comme I'apoptose. 

L'apparition de ces marqueurs est suivie selon la dose et la 
duree du traitement par le produit et permet une approche de son profil 
toxicologique. 

La presente demande a donc-egalement pou^objet un precede 

d'identification, par criblage differentiel qualitatif selon les techniques 
presentees ci-dessus, de marqueurs de toxicite induits dans un systeme 
biologique modele par un compose chimique dont on veut tester le potentiel 
toxique. A cet egard, Pinvention concerne notamment un precede 
d'identification et/ou de clonage d'acides nucleiques specifiques d'un etat 
20 toxique d'un echantilion biologique donne comprenant la preparation de 
banques differentielles qualitatives entre les ADNc et les ARN de Pechantillon 
apres ou sans traitement par un compose toxique test, et la recherche de 
marqueurs de toxicite specifiques des qualites de Pechantillon apres 
traitement. 

25 Selon la deuxieme approche, des abaques pour differentes 

classes de produits toxiques rassemblent leur profil de toxicite selon les 
doses employees et selon les durees des traitements pour un tissu ou un 
modele cellulaire de reference. A chaque point de ces abaques, des 
banques d'ADNc caracteristiques des differences genetiques qualitatives 

30 peuvent etre etablies. Ces banques sont des banques differentielles 
qualitatives, i.e., elles sont obtenues par extraction des informations 
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genetiques du. point choisi dans les abaques et du point correspondent au 
. module tissulaire ou cellulaire- controle. Comme cela est illustre dans les 

exemples, le criblage differentiel qualitatif repose sur i'hybridation d'ARNm 

extraits d'une situation avec les ADNc issues d'une autre. Comme indique 
5 plus haut, le criblage differentiel qualitatif peut etre egalement mene a partir 

d'ARN totaux ou d'ARN nucleaires contenant les premessagers. - 
A cet egard, I'invention conceme un precede de determination 

ou devaluation de la toxicite d'un compose test sur un echantillon biologique 

donne comprenant I'hybridation : 
10 - de banques differentielles entre les ADNc et les ARN dudit 

echantillon biologique a I'etat sain et a un ou differents stades de toxicite 

resultant d'un traitement dudit echantillon avec un compose toxique de 

reference, avec, 

. _-; .--une preparation d'acides-nucleiques de I'echantillon biologique 

15 traite par ledit compose test, et 

- revaluation du potentiel toxique du compose test par analyse 
du degre d'hybridation avec les differentes banques. 

Selon ce procede, pour chaque situation (doses de compose et/ou 
temps d'incubation), deux hybridatiohs reciproques sont avantageusement 
20 realisees, entre : 

- les ARN de la situation A (test) et les ADNc de la 
situation B (reference) ( rA/cB) 

- les ARN de la situation B (reference) et les ADNc de la 
situation A (test) (rB/cA). 

25 A chaque situation toxique de reference, a chaque point des 

abaques, correspondent done deux banques de criblage differentiel qualitatif. 
L'une de ces banques regroupe les variations qualitatives, e'est a dire 
notamment les epissages altematifs, specifiques de la situation normale de 
reference alors que I'autre banque rassemble les epissages specifiques des 

30 evenements toxiques. Ces banques sont repliquees sur des supports solides 
tels des filtres de nylon ou de nitrocellulose ou avantageusement sur des 



Best Available Copy 43 

chips. Ces banques fornixes initialement par des fragments d'ADNc de 
longueur variable (selon les evenements-d'epissages concernes) peuvent 
etre optimisees par I'emploi d'oligonucleotides derives des sequences isolees 
initialement. 

5 Lorsqu'un compose chimique est -propose pour un 

developpement pharmaceutique, il peut etre applique sur les memes 
modeles tissulaires ou cellulaires que ceux repertories dans les abaques de 
toxicite. Des sondes moleculaires peuvent ensuite etre realisees a partir 
d'ARNm extraits des echantillons biologiques traites par le compose 

10 chimique d'interet. Ces sondes sont ensuite hybridees a des ftltres portant 
I'ADNc des banques rA/cB et rB/cA. Par exemple, la banque rA/cB peut 
contenir les sequences specifiquement presentes dans la situation normale 
et la banque rB/cA les elements d'epissage alternatifs specifiques de la 
situation- deJoxicite^Lfrroocui te ou la t oxicite d u compose chimique est alors- 

15 aisement evaluee en fonction des profils d'hybridation d'une sonde derivee 
d'ARNm extraits du modele tissulaire ou cellulaire de reference traite par le 
compose teste: 

- une hybridation efficace avec la banque rA/cB et aucun 
signal sur la banque rB/cA revele une absence de toxicite du compose sur le 

20 modele etudie 

- Phybridation de la sonde avec des clones de la banque 
rB/cA indique une toxicite induite par le compose teste. 

Des exemples d'application de constitutions de telles banques 
peuvent etre foumis par des modeles de culture d'hepatocytes, telle la lignee 
25 HepG2, de cellules epith£iiales renales, telle la lignee HK-2, ou de cellules 
endothelials, telle la lignee ECV304, traites par des agents toxiques tel 
Pethanol, la camptoth6cine ou le PMA. 

Un exemple de choix peut egalement etre fourni par ('utilisation 
en cosm6tologie de modeles de culture de peau traites ou non par des 
30 agents toxiques ou irritants. 

La presente demande a done egalement pour objet des 
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banques de criblage differential (entre les ADNc et les ARN), realisees a 
partir d'organes, de tissus ou de cultures cellulaires de reference traites avec 
des composes chimiques representatifs de grandes classes d'agents 
toxiques selon les abaques decrites dans la litterature. L'invention concerne 
5 aussi I'etalement de ces banques sur des filtres ou sur des supports connus 
de rhomme del'art (nitrocellulose, nylon...). Avantageusement ces supports 
peuvent etre des chips ou puces qui definissent ainsi des puces de 
genotoxicite. L'invention concerne en outre I'exploitation qui peut etre faite du 
sequencage des differents clones qui constituent ces banques dans le but 

10 d'elucider les mecanismes mis en jeu par Taction des differents toxiques, 
ainsi que I'utilisation de ces banques pour les hybrider avec des sondes 
provenant de cellules ou de tissus traites par un compose chimique ou un 
produit pharmaceutique dont on veut evaluer la toxicite. Avantageusement, 
...... INnvention-conceme-des^anques^cides-nucleiques-telles que definies ci-- 

15 avant, preparees a partir de cellules de la peau traitees en differentes 
conditions toxiques. L'invention concerne en outre un kit comprenant ces 
differentes banques differentielles de la peau. 

L'invention concerne egalement I'utilisation des methodes, 
acides nucleiques ou banques decrits ci-dessus pour evaluer (predire) ou 

20 ameiiorer le potentiel therapeutique de composes tests 
(genopharmacologie). 

Dans cette utilisation, le principe mis en application est tres 
proche de celui decrit precedemment. Des banques differentielles de 
reference sont etablies entre les ADNc et les ARN d'une culture cellulaire ou 

25 d'un organe dans une situation controle et de leur equivalent mimant un 
modele de pathologie. L'efficacite therapeutique d'un produit peut alors etre 
evaluee en suivant sa capacite a antagoniser les variations qualitatives de 
I'expression genique qui sont specifiques du modele pathologique. Cela est 
mis en Evidence par la modification du profit d'hybridation d'une sonde issue 

30 du modele pathologique sur les banques de references: sans traitement, la 
sonde n'hybride qu'avec la banque qui contient les signatures specifiques de 
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ia maiadie. Apres traitement avec un produit efficace, ia sonde bien que 
provenant du modele pathologique hybride preferentiellement avec I'autre 
banque, qui porte les signatures du modele equivalent sain. 

A cet egard, I'invention concerne egalement un procede de 
5 determination ou devaluation de Pefficacite therapeutique d'un compose test 
sur un echantillon biologique donne comprenant I'hybridation : 

- de banques differehtielles entre les ADNc et les ARN dudit 
echantillon biologique a I'etat sain et a (differents stades de developpement 
de) I'etat pathologique avec, 

10 - une preparation d'acides nucleiques de I'echantillon biologique 

traite par ledit compose test, et 

- revaluation du potentiel therapeutique du compose test par 
analyse du degre d'hybridation avec les differentes banques. 

Urt-e xemp l e d'u ne telle application peut §tre foumi par— un- 

15 modele d'apoptose mimant certains aspects de la neurodegenerescence qui 
sont antagonises par des facteurs trophiques de reference. Ainsi les cellules 
derivees de pheochromocytdmes PC12 differenciees en corps neuronaux en 
presence de NGF entrent en apoptose par retrait de ce facteur de 
croissance. Cette apoptose est accompagnee par expression de nombreux 

20 marqueurs de mort cellulaire programmee dont plusieurs sont regules par 
epissage altematif et dont Papparition est inhibee par action d'IGFI. Deux 
banques issues de criblage differentiel qualitatif sont etablies a partir 
d'ARNm extraits de cellules PC12 differenciees entrees en apoptose par 
retrait de NGF d'une part et a partir de PC12 differenciees sauvegardees de 

25 I'apoptose par ajout d'IGFI d'autre part. Sur ces banques peuvent etre 
hybridees des sondes realisees a partir d'ARNm extraits de PC12 
differenciees entrees en apoptose et dont ia survie est amelioree par 
traitement avec un produit neuroprotecteur a tester. L'efRcacite de I'inversion 
des caracteristiques qualitatives induites par le compose test peut done etre 

30 appreciee par la capacite de la sonde a hybrider specifiquement les clones 
specifiques de la banque representative des cellules dont la survie est 
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amelioree. Ce test peut par la suite etre utilise pour tester I'efficacite de 
- derives du compose ou~ de tout autre nouvelle famille de composes 
neuroprotecteurs et en ameliorer le profil pharmacologique. 

Dans un mode de realisation particulier, le procede de 
5 1'invention permet d'evaluer I'efficacite d'une compose test neuroprotecteur 
par hybridation avec une banque differentielle selon 1'invention entre une 
cellule nerveuse saine et cette cellule presentant un modele de 
neurodegenerescence. 

Dans un autre mode, il s'agit de tester un compose anti-tumoral 
10 sur des banques differentielles etablies a partir d'un echantillon de cellules 
tumorales et un echantillon sain. 

Comme indique ci-avant, le procede de 1'invention peut en outre 
etre utilise pour ameliorer les proprietes d'un compose, en testant differents 

derives, pour leur capacite a-4nduire un-prefil d'hybridation- proche- de la 

15 banque representative de I'echantillon sain. 

L'invention conceme egalement I'utilisation des methodes, 
acides nucleiques ou banques decrits ci-dessus en pharmacogenomique, 
i.e., pour evaluer (predire) la reponse d'un patient a un compose ou 
traitement test. 

20 La pharmacogenomique a pour ambition d'etablir des profils 

genetiques de patients afin de determiner quel traitement est susceptible 
d'etre couronne de succes pour une pathologie donnee. Les techniques 
decrites dans la presente invention permettent a cet egard d'etablir des 
banques d'ADNc representatives des differences qualitatives qui existent 

25 entre une situation pathologique qui repond a un traitement donne et une 
autre qui repond peu ou mal, susceptible d'etre I'objet d'une autre strategie 
therapeutique. Ces banques de references etablies, elles peuvent etre 
hybridees avec des sondes realisees a partir d'ARN messagers de patients. 
Les resultats d'hybridation permettent de savoir quel patient a un profil 

30 d'hybridation correspondent a la situation de repondeur ou de non repondeur 
et ainsi d'affiner le choix de traitement. 
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Dans cette application, le but est d'une part de proposer en 
fonction du patient le traitementleplus approprie, le plus susceptible d'etre 
couronne de succes et d'autre part d'enroler dans un traitement les patients 
les plus susceptibles d*y repondre avec succes. Comme dans les autres 
s applications, deux banques de criblage differentiel qualitatif sont realisees: 

H'une a partir d'un module ou d'un echantillon pathologique connu pour 

repondre a un traitement, I'autre a partir d'un autre modele ou echantillon 
pathologique qui repond peu ou mal a Taction therapeutique. Ces deux 
banques sont ensuite hybridees avec des sondes provenant d'ARNm extraits 
10 de biopsies de differents patients. Selon que ces sondes hybrident 
preferentiellement avec les epissages altematifs specifiques de I'une ou 
I'autre situation, les patients peuvent etre repartis en repondeurs et en non 
repondeurs au traitement de reference qui a defini les modeles de depart. 

A-cet-egard^-JUovention- concerne egalement un precede de 
15 determination ou devaluation de la reponse d'un patient a un compose ou 
traitement test comprenant Phybridation : 

- de banques differentielles entre les ADNc et les ARN d'un 
echantillon biologique repondeur audit compose/traitement et d'un 
echantillon biologique non-repondeur ou mal-repondeur audit 

20 compose/traitement, avec, 

- une preparation d'acides nucleiques d'un echantillon 
biologique pathologique du patient, et 

- revaluation du potentiel repondeur du patient par analyse du 
degre d'hybridation avec les differentes banques. 

25 Un exemple de choix de I'apport du criblage differentiel qualitatif 

a la pharmacogenomique est constitue par un criblage differentiel qualitatif 
entre deux tumeurs de meme origine histologique, I'une regressant lors du 
traitement par un compose antitumoral (par exemple un transfert d'un ADNc 
codant pour la proteine p53 sauvage par therapie genique), I'autre se 

30 montrant refractaire a ce traitement. La premiere retomb6e de la constitution 
de banques de differences qualitatives entre ces deux situations est de 



WO 99/46403 

Best Available Copy 48 



determiner, par analyse des clones qui constituent ces banques, quels 

_ rnecanismes moleculaires sont mobilises lors de la regression du premier 

modele et ne sont pas presents dans le deuxieme. 

Ensuite, I'utilisation de filtres ou tout autre support presentant les 

5 ADNc de ces banques permet de realiser des hybridations avec des sondes 

- derivees d'ARNm de bbpsiesdelumeurs dont on veut anticiper la reponse 
audit traitement. Ces resultats permettent ainsi de proposer un enrolement 
optimise des patients dans un protocole clinique. 

Un exemple particulier de ce procede consiste a determiner la 

10 reponse de tumeurs a un traitement par le gene suppresseur de tumeur p53. 
II a en effet ete decrit que certains patients et certaines tumeurs repondent 
plus ou moins bien a ce type de traitement (Roth et al., Nature Medicine, 2 
(1995) 958). II est done important de pouvoir determiner quels types de 
tumeurs.. et/ou quels patients sont~sensibles-& -un traitement-par-theFapie- 

15 genique par p53 sauvage, afin d'optimiser le traitement et de favoriser 
I'enrdiement des patients dans les essais cliniques en cours. Le procede de 
I'invention permet avantageusement de faciliter ces etapes en proposant des 
banques specifiques des qualites de cellules repondeuses et de cellules non 
repondeuses a p53. Des exemples de modeles cellulaires p53-sensibles ou 

20 resistants sont decrits par exemple par Sabbatini et al. (Genes Dev. 9 (1995) 
2184) ou par Roemer et al. (Oncogene 12 (1996) 2069). L'hybridation de ces 
banques avec des sondes derivees de biopsies de patients permet aisement 
d'evaluer leur potentiel repondeur. En outre les banques specifiques 
permettent egalement d'identifier des acides nucleiques impliques dans la 

25 reponse a p53. 

La pr6sente demande concerne done egalement 
I'etablissement de banques de criblage differentiel a partir d'echantillons 
pathologiques, ou de modeles de pathologie, qui repondent differemment a 
au moins un agent pharmacologique. Ces banques peuvent etre des 

30 banques restreintes, complexes ou autologues comme definies ci-dessus. 
Elle concerne aussi I'etalement de ces banques sur des filtres ou sur des 
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supports connus de I'homme de I'art (nitrocellulose, nylon...). 
Avantageusement ces supports peuvent §tre des chips ou puces qui 
definissent ainsi des puces de pharmacogenomique. L'invention porte encore 
sur 1'exploitation qui peut etre faite du sequencage des differents clones qui 
s constituent ces banques dans le but d'elucider les mecanismes qui president 
— — aux differences de reponses d'echantillons pathologiques a differents 
traitement, ainsi que ('utilisation de ces banques pour les hybrider avec des 
sondes provenant de biopsies provenant de situations pathologiques dont on 
veut anticiper la reponse au traitement de reference qui definit les banques. 

10 La presente invention decrit ainsi que des variations dans les 
formes et/ou profits d'epissages constituent des sources de marqueurs de 
pharmacogenomique, c'est-a-dire des sources de marqueurs permettant la 
mise en evidence de la capacite et de la maniere d'un patient a repondre a 
des traitements. --A-cet-egaraV invention a done egalement pour- objet- 

15 ('utilisation de rintervariabilite, entre individus, des isoformes generees par 
epissage alternatif (analyse du spliceome) comme source de marqueurs de 
pharmacog6nomique. L'invention conceme aussi ('utilisation de modifications 
d'epissage induites par des traitements comme source de marqueurs de 
pharmacogenomique. Ainsi, comme explique ci-avant, les methodologies 

20 DATAS de l'invention permettent de generer des acides nucleiques 
representatifs des differences qualitatives entre deux echantillons 
biologiques. Ces acides nucleiques, ou des formes derivees (sondes, 
amorces, acides complementaires, etc.) peuvent etre utilises pour I'analyse 
du spliceome de sujets, en vue de mettre en evidence leur capacite/maniere 

25 de repondre a des traitements, ou leur predisposition a tel 
traitement/pathologie, etc. 

Ces differents exemples generaux illustrent Tinteret des 
banques de criblage differentiel qualitatif dans des etudes de genotoxicite, 
30 genopharmacologie, pharmacogenomique ainsi que dans des recherches de 
cibles d'interet diagnostique ou therapeutique. Ces banques sont issues du 
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clonage des differences qualitatives qui existent entre deux situations 

physiopathologiques. Puisqu'une autre utilisation des ADNc representatifs de 

ces differences qualitatives est de constituer des sondes destinees a cribler 
une banque d'ADN genomique dont les caracteristiques ont ete decrites ci 
5 avant, une telle approche peut etre egalement mise en oeuvre pour toute 
6tude de genotoxicite, genopharmacologie et pharmacog6nomique ainsi que 
d'identification de g§ne. Dans les etudes de genotoxicite par exemple, les 
clones genomiques restraints par la taille de leurs insertions statistiquement 
a un seul intron ou a un seul exon sont classes sur des filtres en fqnction de 
10 leur hybridation avec des sondes DATAS provenant de I'analyse differentielle 
qualitative entre une population cellulaire ou un tissu de reference et les 
memes cellules ou tissu traites par un compose toxique de reference. Ces 
clones representatifs des differentes classes de toxicite etant selectionnes, il 

^.peut-ensuite etre precede a une hybridation -de -ces clones avec une-sonde- — - 

15 derivee des ARN messagers totaux d'une meme population cellulaire ou d'un 
meme tissu traite par un compost dont on veut apprecier le potentiel toxique. 

D'autres avantages et applications de la presente invention 
apparattront a la lecture des exemples qui suivent, qui doivent etre 
consideres comme illustratifs et non limitatifs. Les champs d'application de 
20 i'invention sont representes sur la figure 7. 

LEGENDE DES FIGURES 

Figure 1 . Representation schematique des criblages differentiels selon 
25 I'invention (figure 1A) utilisant une (figure 1B) ou deux (figure 1C) 
hybridations, et utilisation des acides nucleiques (figure 1 D). 

Figure 2. Representation schematique decrivant I'obtention d'hybrides 
ARN/ADN permettant de caracteriser les sequences ARN simple brin, 
30 signatures specifiques de I'etat pathologique ou de I'etat sain. 
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Figure 3. Representation schematique decrivant un moyen permettant 
d'isoler et de caracteriser par sequencage les sequences d'ARN simple brin 
specifiques d'une situation pathologique ou d'une situation saine. 

5' Figure 4. Representation schematique decrivant un autre moyen 

permettant de caracteriser par sequencage tout ou une partie des ARNs 
simple brin specifiques d'une situation pathologique ou d'une situation saine. 

Figure 5. Representation schematique permettant d'isoler les produits 
10 d'epissages alternatifs grace a des structures R-loop 

Figure 6. Representation schematique du criblage differentiel qualitatif 
par restriction de boucles (formation d'homoduplexes ADNcdb/ADNc et 
extractions-des. informations T ~-Eigure-6A) . J et- description des informations — 
15 obtenues (Figure 6B). 

Figure 7. Apports du criblage differentiel qualitatif aux differentes 
etapes de la recherche et du developpement pharmaceutique. 

20 Figure 8. Isolation d'un domaine differentiellement episse dans le 

modele grb2/grb33. A) Production des ARNs synthetiques de grb2 et de 
grb33. B) Suivi des premieres etapes de DATAS conduisant a la 
caracterisation d'un fragment ARN correspondant au domaine 
differentiellement episse ; 1 : ARN de grb2, 2 : Hybridation entre I'ARN de 

25 grb2 et I'ADNc de grt>33, 3 : Hybridation entre I'ARN de grb2 et I'ADNc de 
grb2, 4 : Hybridation entre I'ARN de grb2 et de I'eau, 5 : Surnageant apres 
passage sur billes Streptavidine de (2), 6 : Surnageant apres passage sur 
billes Streptavidine de (3), 7: Surnageant apres passage sur billes 
Streptavidine de (4), 8 : Digestion du duplex ARN grb2 / ADNc grb33 a la 

30 Rnase H, 9 : Digestion du duplex ARN grb2 / ADNc grb2 a la Rnase H, 10 : 
Digestion de I'ARN grb2 a la Rnase H, 11 : pareil que (8) apres passage sur 
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colomne d'exclusion, 12 : pareil que (9) apres passage sur colomne 
d'exclusion,. .13.: pareil que (10) apres passage sur colomne d'exclusion, 

Figure 9 . Representation des populations d'ARNs non appariees 
5 issues de la digestion par la Rnase H a partir de duplexes ARN / ADNc 
simple brin provenant de cellules HepG-2 traitees ou non a I'ethanol. 

Figure 10 . Representation des populations d'ADNc double brin 
generees par une des variantes de DATAS. 1 a 12 : PCRs a partir de 
10 populations de boucles d'ARNs issues de la digestion a la Rnase H, 13 : 
PCR a partir d'ADNc total. 



Figure 11. Application de fa variante de DATAS faisant intervenir les 

ADNr, double brin sur le modele grb2/grb33.-A) Analyse sur-gel-diagafose 

is des complexes apres hybridation : 1 : ADNc double brin grb2 / ARN grb33, 
2 : ADNc double brin grb2 /ARN grb2, 3 : ADNc double brin grt>2 / eau. B) 
Digestion des echantillons 1,2 et 3 de A) par la nuclease S1 et la nuclease 
" Mung Bean " : 1 a 3 : complexes 1 a 3 avant traitement au glyoxal ; 4 a 6 : 
complexes 1 a 3 apres traitement au glyoxal ; 7 a 9 : Digestions de 1 a 3 par 
20 nuclease S1 ; 10 a 12 : Digestions de 1 a 3 par nuclease Mung Bean. 

Figure 12. Application de la variante de DATAS faisant intervenir les 
ADNc simple brin et la Rnase H sur un systeme de cellules HepG2 traitees 
ou non a I'ethanol 0.1M pendant 18 heures. Les inserts clones ont ete 
25 transferes sur membrane apres electrophorese sur gel d'agarose et soumis a 
hybridation a I'aide de sondes correspondant aux situations traitees (Tr) ou 
non (NT). 

Figure 13. Mode operatoire pour evaluer le potentiel toxique d'un 
30 produit. 
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Figure 14. Mode operatoire pour suivre I'efficacite d'un produit. 

Figure 15. Mode operatoire pour etudier la susceptibilite d'une 
situation pathologique a un traitement. 

5 

Figure 16. Analyse- d'hybridation differentielle de clones issus de 
DATAS a partir d'ARNs extraits de cellules induites et d'ADNc extraits de 
cellules non induites. A) Utilisation de colonies bacteriennes deposees et 
lysees sur membrane. B) Southern Blot effectue a partir d'une selection de 
10 clones de A. 

Figure 17. Sequences nucleotidique et peptidique de ASHC (SEQ ID 
NO:9et10). 



15 Figure 18. Tests de cytotoxicite et d'apoptose sur cellules HepG2 

traitees A) a I'ethanol ; B) a la camptothecine ; C) au PMA. 

Figure 19. Reactions de RT-PCR effectuees a partir d'ARNs extraits 
de cellules HepG2 traitees ou non (NT) par I'ethanol (Eth.), la camptothecine 
20 (Camp.) et le PMA (PMA) permettant I'amplification de fragments 
correspondants a des domaines de MACH-a, BCL-X, FASR et beta-actine 
comme contrdle de normalisation. 

Dans les exemples et la description de I'invention, il est fait references 
25 aux sequences de la Liste de Sequences, qui contient le texte libre suivant: 

<223> OLIGO 

<223> OLIGO 

<223> OLIGO 

<223> OLIGO 
30 <223> OLIGO 

<223> OLIGO 
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<223> OLIGO 
<223> OLIGO 
<223> OLIGO 
<223> OLIGO 
5 <223> OLIGO 

<223> OLIGO 

TEMPLES 

10 1. CLONAGE DIFFERENTIEL DES EPISSAGES ALTERNATIFS ET 

AUTRES MODIFICATIONS QUALITATIVES DES ARNS EN UTILISANT 
DES ADNc SIMPLE-BRINS 

Les-ARN messagers correspondent -a~deux situations, Tune normale- 
15 (mN) et I'autre pathologique (mP), sont isoles a partir de biopsies ou de 
cellules en culture. Ces ARN messagers sont convertis en ADN 
complementaires (cN) et (cP) a I'aide de reverse transcriptase (RT). Des 
hybrides mN/cP et cN/mP sont ensuite realises en phase liquide (se reporter 
au schema de la figure 2 illustrant un des deux cas aboutissant a la 
20 formation de cN/mP). 

Ces hybrides sont avantageusement realises en emulsion phenolique 
(technique PERT ou Phenol Emulsion DNA Reassociation Technique) 
maintenue par thermocycles (Miller, R.,D. and Riblet, R., 1995, Nucleic Acids 
Research, vol 23, n°12, pp 2339-2340). Typiquement, cette etape 
25 d'hybridation est realisee entre 0,1 a 1 \ig d'ARN polyA+ et 0,1 a 2^g d'ADN 
complementaire dans une emulsion formee d'une phase aqueuse (tampon 
phosphate de sodium 120mM, NaCI 2.5M, EDTA 10mM) et d'une phase 
organique representant 8% de la phase aqueuse et constitute de phenol 
bidistille. 

30 Une autre technique est egalement avantageusement 

employee de facon a obtenir des heteroduplex : a Tissue de la transcription 
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inverse, I'ADNc neosynthetise est separe de I'amorce oligodT biotinylee sur 
colonne d'exclusion. 0,1 a 2ng de cet ADNc est coprecipite avec 0,1 a 1ng 
d'ARN polyA+ en presence de 0,3M d'acetate de sodium et de deux volumes 
d'ethanol. Ces acides nucleiques coprecipites sont repris dans 30^1 d'un 
5 tampon d'hybridation qui contient 80% de formamide, 40mM de PIPES 
(piperazinebis(2-ethanesulfonic acid)) ph6,4, 0.4M de NaCI et 1mM d'EDTA. 

Les acides nucleiques en solution sont denatures par chauffage 
10mn a 85°C puis leur hybridation est realisee pendant au moins 16h et 
jusqu'a 48h a 40°C. 

10 L'interet de la technique d'hybridation en formamide est de 

permettre des conditions de plus forte selectivity lors de I'appariement des 
brins d'ADNc et d'ARN. 

A Tissue de chacune de ces deux techniques d'hybridation, 
—n ous dispo s o ns-tfheteroduplex- ARN/ADN dont la perfection d'appariemenf- 
15 depend de Tefficacite de la RT a synthetiser la longueur totale des ADNc. 
Demeurent egalement sous forme de simples brins les regions d'ARN (et 
d'ADN) qui correspondent aux epissages alternatifs qui differencient les deux 
etats physiopathologiques etudies. 

Le but de la methode est ensuite de caracteriser 1'information 
20 genetique portee par ces boucles d'epissage. 

Pour cela, les heteroduplex sont purifies par capture des ADNc 
(amorces avec des oligodT biotinyles) grace a des billes portant des 
groupements streptavidines. Avantageusement ces billes sont de billes 
douees de proprietes magnetiques, ce qui permet de les separer des ARN 
25 non engages dans les heteroduplex par action d'un separateur magnetique. 
De telles billes et de tels separateurs sont disponibles commercialement. 

Sont isoles a ce stade de la procedure les heteroduplex et les 
ADNc non engages dans des hybridations avec des ARN. Ce materiel est 
ensuite soumis a Taction de la RNaseH qui va specifiquement hydrolyser les 
30 regions d'ARN hybridees avec les ADNc. Les produits resultant de cette 
hydrolyse sont d'une part les ADNc et d'autre part les fragments d'ARN qui 
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correspondent aux boucles d'epissage ou aux regions non hybridees du fait 
du rendement partiel de la transcriptase inverse. Les fragments d'ARN sont 
separes de I'ADN par separation magnetique selon le meme mode 
operatoire que celui mentionne plus haut et par digestion avec de la DNase 
s exempte de toute contamination par une activite Rnase. 

1.1. Validation de la technique DATAS sur les variants 
d'epissage du gene Grb2 

Une mise en evidence de la faisabilite de cette approche a ete 

10 realisee sur un systeme in-vitro utilisant un ARN correspondant a la region 
codante de Grb2 d'une part et un ADNc simple brin complementaire a la 
region codante de Grb3.3. Grb2 est un gene possedant une phase codante 
de 651 paires de bases. Grb33 est une isoforme de grb2 generee par 

epissage alternatif et coraprenantune-deletion de-121 paires de bases dans 

15 le domaine fonctionnel SH2 de grb2 (Fath et.al, Science (1994), 264, 971-4). 
Les ARNs de Grb2 et de Grb33 sont synthetises selon les techniques 
connues de I'homme du metier a partir d'un plasmide contenant la sequence 
codante de Grb2 ou de Grb33 sous contrdle du promoteur T7 a I'aide du kit 
RiboMax (Promega). L'analyse des produits demontre une synthese 

20 homogene (figure 8A). Dans un but de visualisation, TARN de Grb2 a 
egalement ete rendu radioactif par incorporation d'une base marquee lors de 
la transcription in-vitro a I'aide du kit RiboProbe (Promega). Les ADNc de 
Grb2 et de Grb3.3 ont ete synthetises par transcription inverse a partir des 
ARNs synthetiques produits ci-dessus, du kit Superscript II (Life 

25 Technologies) et d'une amorce oligonucleotidique biotinylee commune a 
Grb2 et a Grb33 correspondant au complementaire de la sequence (618- 
639) de Grb2. Les ARNs et ADNcs ont ete traites selon les indications des 
fournisseurs (promega, Life Technologies), purifies sur colonne d'exclusion 
(Rnase free sephadex G25 ou G50, 5 Prime, 3 Prime) et quantifies par 

30 spectrophotometrie. 

Les premieres etapes de DATAS ont ete appliquees en 
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associant, en suspension 10ng d'ARN marque de Grb2 avec : 

1 . 100 ng d'ADNc de grb33 biotinyle, 

2. 100 ng d'ADNc de grb2 biotinyl6, 

3. del'eau 

5 dans 30 ul d'un tampon d'hybridation qui contient 80% de formamide, 40 mM 
PIPES (pH 6,4), 0,4 M NaCI, 1 mM EDTA. Les acides nucleiques sont 
denatures par chauffage 10 mn a 85 °C, puis I'hybridation est reaiisee 
pendant 16 heures a 40°C. Apres capture a I'aide de billes streptavidine, les 
echantillons sont traites a la RNase H comme decrit precedemment. 

10 L'analyse de ces etapes est realisee par electrophorese sur gel 

d'acrylamide a 6% suivi d'un traitement des gels a I'aide d'un Instant Imager 
(Packard Instruments) permettant la qualification et la quantification des 
especes issues de I'ARN de grb2 marque (figure 8B). Ainsi, les puits 2.3 et 4 
indique nt q u e les d u plexes grb2/grb33 et grb2/grb2 se sont formes de4a§er+ 

15 quantitative. La migration du complexe grb2/grb33 est retardee par rapport a 
celle de I'ARN de grb2 (puits 2) alors que celle du complexe grb2/grb2 est 
augmentee (puits 3). Les puits 5,6 et 7 correspondent aux echantillons non 
retenus par les billes streptavidine demontrant que 80% des complexes 
grb2/grt>33 et grb2/grb2 ont ete retenus sur les billes alors que I'ARN de grb2 

20 seul, non biotinyle, se retrouve exclusivement dans le sumageant des billes. 
Le traitement a la Rnase H libere, outre les nucleotides libres qui migrent 
plus vite que le bleu de Bromophenol (BPB) une espece migrant en deca du 
bleu de xylene Cyanol (XC) (marque par une fleche sur la figure) et ce 
specifiquement dans le puits 8 correspondant au complexe grb2/grb33 par 

25 rapport aux puits 9 et 10 qui correspondent au complexe grb2/grb2 et a 
I'ARN de grb2. Les puits 1 1,12 et 13 correspondent aux puits 8,9 et 10 apres 
passage des echantillons sur une colomne d'exclusion pour eliminer les 
nucleotides libres. La migration observee dans les puits 8 et 1 1 est celle 
attendue pour une molecule d'ARN correspondant a la deletion de 121 

30 nucleotides differenciant grb2 de grb33. 

Ce resultat montre bien la possibility d'obtenir les boucles 
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d'ARN generees. par la formation d'heteroduplex entre deux sequences 
derivees de deux isoformes d'epissage. 

1.2. Application de la technique DATAS a la generation de 
5 banaues aualitatives de cellules heoatiaues dans un etat sain ettoxique 

Une situation plus complexe a ete etudiee. Dans le cadre de 
I'application de la technologie DATAS comme outil predictif de toxicite de 
molecules, des cellules humaines de type hepatocytaire, HepG2, ont ete 
traitees par de I'ethanol 0,1 M pendant 18 heures. Les ARNs ont ete extraits 
10 a partir des cellules traitees ou non. La variante de DATAS decrite ci-dessus 
(preparation d'ADNc sb biotinyles, hybridations croisees en phase liquide, 
application d'un champs magnetique pour separer les especes, traitement 
RNaseH) a ete appliquee avec les cellules non traitees en situation de 

reference (ou situation A) et les cellules, traitees en situation test (ou situation 

15 B) (figure 9). Les ARNs extraits n'etant pas marques radioactivement , la 
visualisation des populations d'ARN generees par digestion a la RnaseH est 
realisee en effectuant une reaction d'echange du phosphate en 5' des ARNs 
par un phosphate marque, a I'aide de polynucleotide kinase de T4 et de 
gamma-P 32 ATP. Ces marquages sont ensuite deposes sur un gel 
20 d'acrylamide/uree et analyses par exposition a I'aide d'un Instant Imager 
(Packard Instruments). Des signatures complexes issues des hybridations 
A/B et B/A peuvent alors etre visualisees avec un premier groupe de signaux 
migrant faiblement dans le gel et correspondant a des sequences d'acides 
nucleiques de taille importante et un deuxieme groupe de signaux migrant 
25 entre 25 et 500 nucleotides. Ces signatures sont d'intensite beaucoup plus 
faible a partir de la situation A/A suggerant que I'ethanol peut induire une 
reprogrammation de I'epissage des ARNs, traduite par I'existence de signaux 
en A/B et B/A. 



30 13, Clonage et Preparation de banaues a partir des acides 

nucleiques identifies, 
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Plusieurs variantes experimentales sont ensuite envisageables 
pour doner ces fragments d'ARN resistant a Taction de la Rnase H: 

A. Une premiere approche consiste a isoler ces boucles et a les 
5 doner (Figure 3). 

Selon cette approche, il est procede a une ligation 
d'oligonucleotides a chacune des extremites par action de ia RNA iigase 
selon les conditions connues de I'homme de Tart. Ces oligonucleotides sont 
ensuite utilises comme amorces pour effectuer une RT PCR. Les produits de 
10 PCR sont clones et cribles avec des sondes d'ADN complementaires totales 
correspondant aux deux situations physiopathologiques d'interet. Seuls les 
clones hybridant preferentiellement avec une seule des deux sondes 
contiennent les boucles d'epissage qui sont ensuite sequencees et/ou 
_ utilisees pour gen6rer des banques. 

15 

B. La seconde approche (Figure 4) consiste a effectuer une 
transcription inverse sur I'ARN simple brin libere des heteroduplex apres 
action de la RNaseH, initiee a I'aide d'amorces au moins en partie aleatoires. 
Ainsi, il peut s'agir d'amorces aleatoires en 3' et en 5', d'amorces aleatoires 

20 en 3* et determinees en 5', ou encore d'oligonucleotides semi-aleatoires, 
c'est-a-dire comprenant une zone de degenerescence et une zone definie. 

Selon cette strategie, les amorces sont done susceptibles de 
s'hybrider soit n'importe ou sur I'ARN simple brin, soit a chaque succession 
de bases fixee par le choix de I'amorce semi-aleatoire. Une PCR avec des 

25 amorces correspondant aux oligonucleotides decrits ci-dessus permet 
ensuite d'obtenir des sequences derivees des boucles d'epissage. 

La figure 10 (puits 1 a 12) montre I'analyse sur gel d'acrylamide 
des fragments de PCR obtenus a partir de plusieurs essais DATAS et 
couplee a I'utilisation des oligonucleotides semi-aleatoires suivants: 

30 GAGAAGCGTTATNNNNNNNAGGT (SEQ ID NO: 1 , X=T) 
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GAGAAGCGTTATNNNNNNNAGGA (SEQ ID NO: 1, X=A) 

GAGAAGCGTTATNNNNNNNAGGC (SEQ ID NO: 1, X=C) 

GAGAAGCGTTATNNNNNNNAGGG (SEQ ID NO: 1, X=G) 
La comparaison avec la complexity des signaux obtenus en 
5 utilisant les memes oligonucleotides, mais de I'ADNc total comme matrice 
(puits 13) demontre que DATAS a permis de filtrer ("profiler") des 
informations correspondant a des differences qualitatives. 

Cette variante a ete utilisee afin de doner un evenement 
correspondant au domaine ARN de grb2 genere par action de la Rnase H a 
10 partir du duplex ARN grb2 / ADNc simple brin de grb33 selon le protocole 
decrit precedemment (exemple 1.1.). A cette fin, un oligonucleotide de 
sequence : GAGAAGCGTTATNNNNNNNNTCCC (SEQ ID NO: 2), choisi sur 
le modele G AG AAGCGTTATN N N N N N N WXYZ (dans lequel N est defini 
comme- precedemment,- W, X et X-representent -chacun une-base-fixe- - 
15 determinee, et Z repr6sente soit une base determinee soit un groupe. 3'-OH, 
SEQ ID NO: 3) et selectionne pour amplifier un fragment dans la deletion de 
grb2 a ete utilise, permettant de generer un fragment PCR dont le clonage et 
le sequencage a demontre qu'il etait effectivement issu du domaine delete 
de grb2 (194-281 dans grb2). 

20 

Ces deux approches permettent done la production de 
compositions d'acides nucleiques representatifs des epissages differentiels 
dans les deux situations testees qui peuvent etre employees comme sondes 
ou pour construire des banques d'ADNc de differences qualitatives. La 
25 capacite de la technologie DATAS a generer des banques profilees d'ADNc 
representatives de differences qualitatives est egalement illustree par 
I'exemple 1 .4. suivant. 

1.4. Production de banques profilees representatives de 
30 cellules end oth6liales humaines 

Cet exemple a ete realise a partir d'une lignee de cellules 
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endothelials humaines (ECV304). L'anatyse qualitative de I'expression 
genetique a ete realisee a partir d'ARN cytosoliques extraits de cellules en 
proliferation, d'une part, et de cellules en anoTkis (apoptose par privation de 
support d'attachement), d'autre part. 

5 Les cellules ECV ont ete cultivees en milieu 1 99 supplements 

en sels de Earie (Life Sciences). Leur mise en anoTkis a ete realisee par 
passage pendant 4 heures sur bottes de culture traitees au polyHEMA. Lors 
de la preparation des ARN, les cellules ont ete lysees dans un tampon 
contenant du Nonidet P-40. Les noyaux sont ensuite ecartes par 

10 centrifugation. La solution d'extrait cytoplasmique a ete ensuite ajustee de 
maniere a fixer de facon specifique TARN a la matrice de silice Rneasy selon 
les instructions de la societe Qiagen. Apres lavage, les ARN totaux sont 
elues dans de I'eau traitee au DEPC. Les ARNs messagers sont prepares a 
---partir des-ARNs-totaux-pa^-separation sur billes magnetiques Dynabeads 

15 oligo (dT) 25 (Dynal). Apres avoir mis en suspension les billes dans un 
tampon de fixation, TARN total est incube pendant 5 min a temperature 
ambiante. Apres separation magnetique et lavage, les billes sont reprises 
dans un tampon d'elution pour une incubation a 65°C qui libera les ARNs 
messagers. 

20 Les syntheses d'ADN premier brin sont effectuees a partir des 

ARNs messagers en utilisant la Reverse Transcriptase Superscript II ou 
ThermoScript (Life Technologies) a I'aide d'amorces olido (dT). Apres 
RnaseH, les nucleotides libres sont elimines par passage sur colonne 
Sephadex G50 (5 Prime- 3 Prime). Apres extraction au phenol / 

25 Chloroforme et precipitation a I'ethanol, les echantillons sont quantifies par 
absorbance UV. 

Les quantites requises d'ARN et d'ADNc (en ('occurrence 
200ng de chaque) sont combinees et precipitees a I'ethanol. Les 
echantillons sont repris dans un volume de 30jxl dans un tampon 

30 d'hybridation (Hepes (pH 7.2) 40 mM, NaCI 400mM, EDTA 1mM) 
supplements de formamide desionisee (80% (v/v), sauf indication contraire). 
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Apres denaturation 5 min a 70°C, les echantillons sont incubes sur la nult a 
- 40°C. 

Les billes Streptavidine (Dynal) sont lavees puis 
reconditionnees dans un tampon de fixation (2X= Tris-HCI (pH 7,5) 10 mM, 
5 NaCI 2M, EDTA 1 mM). Les echantillons d'hybridation sont amenes a un 
volume de 200 \i\ avec de I'eau puis ajustes a 200 \i\ de billes pour une 
incubation de 60 min a 30°C. Apres capture sur aimant et lavages des billes, 
celles-ci sont reprises dans 150 ^l de tampon RnaseH puis incub§es 
pendant 20 min a 37°C. Apres capture sur aimant, les regions non hybridees 
ont ete relarguees dans le sumageant qui est traite a la Dnase puis extrait 
au phenol acide / chloroforme puis precipite a I'ethanol. Les precipitations a 
l'6thanol de faibles quantites d'acides nucleiques sont effectu6es a I'aide 
d'un polymere commercial SeeDNA (Amersham Pharmacia Biotech) 
permettant de r6cup6rer de-facon quantitative des acides nucleiques-a-partir - 
de solutions tres dilutes (de I'ordre du ng/ml). 

La synthese d'ADNc & partir des echantillons d'ARNs 
provenant de Taction de la RnaseH est effectuee a partir d'hexanucleotides 
aleatoires a I'aide de Superscript II Reverse Transcriptase. L'ARN est 
ensuite degrade a I'aide d'un melange de RnaseH et de Rnase T1. 
L'amorce, les nucleotides non incorpores et les enzymes sont s§pares de 
I'ADNc a I'aide d'une cartouche " GlassMAX Spin ". L'ADNc correspondant 
aux boucles d'epissage est ensuite soumis a une reaction de PCR en 
utilisant des oligonucleotides de type semi-aleatoire deja decrits plus haut 
dans I'invention. En I'occurrence les oligonucleotides choisis sont : 
GAGAAGCGTTATNNNNNCCA (SEQ ID NO: 4) 
La reaction de PCR est realis§e a I'aide de Taq Polymerase sur 30 
cycles : 

• D6naturation initiate : 94°C pdt 1 min. 

• 94°Cpdt30s 

• 55°C pdt 30s 

• 72°C pdt 30s 
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• Extension finale : 72°C pdt 5 min. 

Les produits de PCR ont 6te clones dans le vecteur pGEM-T 
(Promega) possedant un T flottant aux extrem'rtes 3' afin de faciliter le 
clonage de fragments issus de I'activite de la Taq Polymerase. Apres 

5' transformation dans les bacteries JM109 competentes (Promega), les 
colonies obtenues sont repiquees sur filtre de nitrocellulose, et hybridees 
avec des sondes derivees de produits de PCR effectu6es sur des ADNc 
totaux des cellules en proliferation d'une part et en anoTkis d'autre part. Pour 
ces PCR les memes oligonucleotides GAGAAGCGTTATNNNNNCCA sont 

10 utilises. Dans une premiere realisation experimentale, 34 clones hybridant 
pr6f§rentiellement avec la sonde des cellules en apoptose et 13 clones 
hybridant preferentiellement avec la sonde des cellules en proliferation ont 
§te isoles. 

. - Parmi ces 13 clones, 3-Clones contiennent le meme fragment 

15 d'ADNc qui derive du domaine SH2 de la proteine SHC. 

La sequence de ce fragment est la suivante : 
CCACACCTGGCCAGTATGTGCTCACTGGCTTGCAGAGTGGGCAG 
CCAGCCTAAGCATTTGCACTGG (SEQ ID NO: 5) 

^utilisation d'amorces de PCR qui encadrent le domaine SH2 
20 de SHC (oligo5' : GGGACCTGTTTGACATGAAGCCC (SEQ ID NO:6) ; 
oligo3': CAGTTTCCGCTCCACAGGTTGC (SEQ ID NO:7)) a permis de 
caracteriser la deletion du domaine SH2 de SHC qui est observee 
specifiquement dans les cellules ECV en anoTkis. Avec ce couple d'amorce, 
un seul produit d'amplification correspondant a un fragment d'ADNc de 382 
25 paires de bases qui contient le domaine SH2 integre est obtenu a partir 
d'ARN de cellules ECV en phase exponentielle. Un fragment additionnel de 
287 paires de bases est observe lorsque la PCR est realisee a partir d'ARN 
de cellules en anoTkis. Ce fragment supplementaire derive d'un ARN 
messager derive du messager de SHC mais presentant une deletion. 
30 La sequence de cette d&l&tion est la suivante : 

GTACGGGAGAGCACGACCACACCTGGCCAGTATGTGCTCACTGG 
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CTTGCAGAGTGGGCAGCCTAAGCATTTGCTACTGGTGGACCCTGAGGG 

TG-TG (SEQ ID NO: 8). 

Cette delation correspond aux bases 1198 a 1293 de la phase 
ouverte du messager codant pour les formes de 52kDa et 46kDa de la 
5 proteine SHC (Pelicci, G. et al, 1 992, Cell, 70, pp93-1 04). 

Les donnees structurales-des domaines SH2 ainsi que la 
litterature indiquent qu'une telle deletion aboutit a la perte de I 'affinite pour 
les phosphotyrosines puisqu'elle englobe les acides amines impliques dans 
les interactions avec les tyrosine phosphorylees (Waksman, G. et al, 1992, 
10 Nature, vol358, pp646-653). Les proteines SHC etant des adapteurs qui 
connectent differents partenaires par leurs domaines SH2 et PTB 
(PhosphoTyrosine Binding domain), cette d6letion g6nere done un dominant 
negatif naturel de SHC que nous appelons ASHC. Les domaines SH2 des 

proteines dont les genes sont sequences etant-portes par-deux exonsnl-est- 

15 vraisemblable que la deletion identifiee par la methode DATAS correspond a 
un exon altematif du gene SHC. 

Les sequences proteique et nucleique de ASHC sont les 
representees sur la Figure 17 (SEQ ID NO: 9 et 10). 

Le domaine SH2 de SHC etant implique dans la transduction 
20 de nombreux signaux impliques dans la proliferation et la viabilite cellulaires, 
I'examen de la sequence de ASHC permet d'anticiper ses proprietes de 
dominant negatif sur la proteine SHC et sa capacite d'interferer avec 
different signaux cellulaires. 

L'invention conceme egalement cette nouvelle forme epissee 
25 de SHC, le domaine proteique correspondant a I'epissage, tout anticorps ou 
sonde nucleique permettant sa detection dans un echantillon biologique, et 
leurs utilisation diagnostique ou therapeutique, par exemple. 

L'invention concerne en particulier tout variant de SHC comprenant au 
moins une deletion correspondant aux bases 1198 a. 1293, plus 
30 particulierement une deletion de la sequence SEQ ID NO: 8. L'invention 
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concerne plus sp6cifiquement le variant ASHC ayant la sequence SEQ ID 
NO: 9, code par la sequence SEQ ID NO: 10. 

(.'invention concerne aussi toute sonde nucleique, oligonucleotide ou 
anticorps permettant d'identifier le variant ASHC ci-dessus, et/ou toute 

5 alteration du rapport SHC/ASHC dans un echantillon biologique. II peut s'agir 
notamment d'une sonde ou oligonucleotide complementaire de tout ou partie 
de la sequence SEQ ID NO: 8, ou d'un anticorps dirig& contre le domaine 
proteique code par cette sequence. De telles sondes, oligonucleotides ou 
anticorps permettent de detecter la presence de la forme non epissee (e.g., 

o SHC) dans un echantillon biologique. 

Les materiels peuvent en outre etre utilises en paraliele avec des 
sondes, oligonucleotides et/ou anticorps specifiques de la forme epissee 
(e.g., ASHC), c'est-a-dire correspondant par exemple a la r6gion de jonction 
resultant de Tepissage- (loeaKs^e-autouf-du-nudeotide 1198 de la sequence 

5 SEQ ID NO: 10). 

De tels materiels peuvent etre utilises pour le diagnostic de 
pathologies liees a une immunodepression (cancer, traitement 
immunosuppresseur, SIDA, etc.). 

L'invention concerne aussi tout precede de criblage de molecules 

o base sur le blocage (i) du domaine episse dans la proteine SHC (notamment 
pour induire un etat de tol6rance immunitaire par exemple dans les maladies 
autoimmunes ou les rejets de greffes et les cancers) ou (ii) des gains de 
fonction acquis par la proteine ASHC. 

L'invention concerne en outre Putilisation therapeutique de ASHC, et 

:5 notamment pour le traitement de cellules cancereuses ou de cancers (ex 
vivo ou in vivo) dans lesquels une hyperphosphorylation de la proteine SHC 
peut §tre mise en evidence, par exemple. A cet egard, l'invention concerne 
aussi tout vecteur, notamment viral, comprenant une sequence codant pour 
ASHC. II s'agit preferentiellement d'un vecteur capable de transferer des 

io cellules cancereuses ou en proliferation, telles que des cellules musculaires 
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lisses, des cellules endothelials (restenose), des fibroblastes (fibroses), de 
preference d'origine mammifere, notamment humaine. Comme vecteur viral, 
on peut citer notamment des vecteurs adenoviraux, retroviraux, AAV, herpes, 
etc. 

5 2. CLONAGE DIFFERENTIEL DES EPISSAGES ALTERNATIFS ET 

AUTRES MODIFICATIONS QUALITATIVES DES ARNS EN UTILISANT 
DES ADNc DOUBLE-BRINS (FIGURE 5). 

Les ARNs messagers correspondants aux situations normales 

10 (mN) et pathologiques (mP) sont produits, ainsi que les ADNs 
complementaires double brin correspondants (dsN et dsP) par des 
protocoles classiques de biologie moleculaire. Des structures de type "R- 
loop" sont alors obtenues en hybridant mN avec dsP et mP avec dsN dans 
une_solution— contenant- 70% de formamide. Les domaines nueleiques- 

15 differentiellement episses entre la situation N et P resteront sous forme 
d'ADN double brin. Les simples brins d'ADN d&plac§s sont alors traites au 
glyoxal afin d'eviter le redeplacement du brin d'ARN lors du retrait de la 
formamide. Apres retrait de la formamide et du glyoxal puis traitement d la 
RNAseH, nous nous retrouvons avec des structures de type abeille, les 

20 ADNs simples brin non apparies representant les ailes de I'abeille et le 
domaine double brin appareille d'interet representant le corps de I'abeille. 
L'utilisation d'enzymes qui degradent specifiquement I'ADN simple brin 
comme la nuclease S1 ou la Mung Bean nuclease permet I'isolation de I'ADN 
reste sous forme double brin qui est ensuite clone puis sequence. Cette 

25 deuxieme technique permet I'obtention directe d'une empreinte ADN double 
brin du domaine d'interet comparativement au premier protocole qui produit 
une empreinte ARN de ce domaine. 

Cette approche a ete realisee sur le modele grb2/grb33 decrit 
precedemment. L'ADN double brin de grb2 a ete produit par amplification 

30 PCR & partir de I'ADNc simple brin de grb2 et de deux amorces 
nucleotidiques correspondant a la sequence (1-22) de grb2 et S la sequence 
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complementaire de (618-639) de grb2. Ce fragment PCR a ete purifie sur 

gel d'agarose, nettoye sur colonne d'affinlte (JetQuick, Genomed) et 

quantifie par spectrophotometrie. Dans le meme temps, deux ARNs 
synthetiques correspondant aux phases de lecture de grb2 et de grt>33 ont 
5 ete produits a partir de vecteurs plasmldiques comportant les cDNAs de grb2 
ou de grb33 sous contr6le du promoteur T7, a I'aide du kit RiboMax 
(Promega). Les ARNs ont ete purifies selon les instructions du foumisseur et 
nettoyes sur colomne d'exclusion (Sephadex G50, 5 prime-3 prime). 600 ng 
de I'ADN double brin de grb2 (1-639) ont ete associes avec : 
10 1. 3 \ig d'ARN de grb33 

2. 3 ng d'ARN de grb2 

3. del'eau 

dans trois reactions differentes, dans le tampon suivant : 

100-mM-RPES (pH 7-,2>, 35 mM-NaGI, 10 mM EDTA, 70% formamide 

15 deionise (Sigma) 

Les echantillons ont ete amenes a 56 °C puis refroidis a 44 °C 
par increment de -0,2 °C toutes les 10 minutes, lis sont ensuite conserves a 
4 °C. L'analyse sur gel d'agarose revele des modifications de migrations 
dans les puits 1 et 2 par rapport au puits 3 controle (Figure 11 A) indiquant la 

20 formation de nouveaux complexes. Les echantillons sont ensuite traites au 
glyoxal deionise (Sigma) (5% v/v ou 1M) pendant 2 h a 12 °C. Les 
complexes sont ensuite precipites a I'ethanol (0,1 M NaCI, 2 volumes 
d'ethanol), laves a I'ethanol 70%, seches puis repris dans de Peau. lis sont 
enfin traites par la RnaseH (Life Technologies), puis par une enzyme capable 

25 de degrader specifiquement I'ADN simple brin. La nuclease S1 et la 
nuclease " Mung Bean " presentent cette propriete et sont disponibles 
commercialement (Life Technologies, Amersham). De telles digestions 
(incubations de 5 minutes dans les tampons foumis avec les enzymes) ont 
ete analysees sur gel d'agarose (figure 1 1 B). Des digestions significatives 

30 sont uniquement obtenues a partir des complexes issus de la reaction 1 
(grb2/grb33) (figure 11B, puits 7 et 10). Ces digestions semblent plus 
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completes avec la nuclease S1 (puits 7) qu'avec la nuclease " Mung Bean " 
(puits 1 0). Ainsi, la bande correspondant a une taille legerement superieure a 
100 paires de bases (indiquee par une fleche dans le puits 7) a ete purifiee, 
donee dans le vecteur pMos-Blue (Amersham), puis sequencee. Ce 
5 fragment correspond au domaine de 120 paires de bases de grb2, delete 
dansgrb33. 

Cette approche peut maintenant etre effectuee a partir d'une 
population totale d'ARN messager et d'une population totale d'ADNc double 
brin produite selon les techniques connues de I'homme de metier. La 

10 population d'ARN de la situation de reference est hybridee a la population 
d'ADNc double brin de la situation test et reciproquement. Apres application 
du protocole decrit ci-dessus, les digestions sont deposees sur gel d'agarose 
afin d'isoler et de purifier les bandes correspondant a des tallies variant entre 
-50 et 300-paires de-bases, — Ces-bandes sont ensuite donees dans un — 

15 vecteur (pMos-Blue, Amersham) pour donner lieu a une banque d'inserts 
enrichis en des evenements de differences qualitatives. 

3. CONSTRUCTION DE BANQUES ISSUES DE CRIBLAGES 
DIFFERENTIELS QUALITATIFS. 

20 

Les deux exemples decrits ci-dessus aboutissent aux clonages 
d'ADNc representatifs de toute ou partie des sequences epissees 
differentiellement entre deux situations physiopathologiques donnees. Ces 
ADNc permettent la constitution de banques par insertion de ces ADNc dans 

25 des vecteurs plasmidiques ou phagiques. Ces banques peuvent etre 
presentees sur des filtres de nitrocellulose ou tout autre support connu de 
I'homme de I'art, tels des chips ou biopuces ou membranes. Ces banques 
peuvent etre conservees au froid, a Pabri de la lumiere. Ces banques, une 
fois deposees et fix6es sur support par les techniques classiques, peuvent 

30 etre traitees par des composes pour eliminer les bacteries h6tes qui 
permettent la production des plasmides ou des phages. Ces banques 
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peuvent egalement avantageusement etre constituees de fragments d'ADNc 
— correspondant aux ADNc clones- mais prepares par PCR de facon a ne 
deposer sur filtre que les sequences derivees des evenements d'epissages 
alternatifs. 

5' L'une des caracteristiques et en meme temps I'une des 

originalites du criblage differentiel qualitatif est que cette technique aboutit de 
facon avantageuse non pas a une mais a deux banques differentielles ("paire 
de banque") qui represented I'ensemble des differences qualitatives qui 
existent entre deux situations donnees. En particulier, l'une des banques 

10 d'epissage differentiel de ('invention represente la signature des qualites de 
la situation physiologique test par rapport a la situation physiologique de 
reference, et Pautre banque represente la signature des qualites de la 
situation physiologique de reference par rapport a la situation physiologique 

tesL.-Ce_couple de banques-est egalement -designe paire -de banq«es-eu 

15 "banque differentielle d'epissage". 

L'un des apports du criblage differentiel qualitatif etant de 
permettre d'evaluer le potentiel toxique d'un compose, comme cela est 
indique dans le chapitre suivant, un bon exemple de mise en ceuvre de la 
technologie est I'obtention par DATAS de clones d'ADNc correspondant a 

20 des sequences specifiques de cellules HepG2 na'fves, d'une part, et traitees 
par de I'ethanol, d'autre part. Ces cellules presentent des signes de 
cytotoxicite et une degradation de leur ADN par fragmentation 
internucleosomale a partir de 18h en presence de 1M d'ethanol. De facon a 
obtenir des marqueurs precoces de la toxicite ethanolique, les ARN 

25 messagers ont ete prepares a partir de cellules naTves et de cellules traitees 
pendant 18h par de I'ethanol a la concentration de 0,1 M. Apres mise en 
oeuvre de la variante de DATAS qui utilise I'ADNc simple brin et la Rnase H, 
les ADNc clones obtenus ont ete amplifies par PCR, soumis a une 
electrophorese sur gel d'agarose et ensuite transferes sur un filtre de nylon 

30 selon les techniques connues de I'homme de Tart. Pour chaque ensemble de 
clones specifiques d'une part des differences qualitatives specifiques de 
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I'etat naif et d'autre part des sequences specifiques des cellules traitees par 
I'ethanol, deux repliques identiques de filtres sont effectuees. Ainsi les 
empreintes de chaque ensemble de clones sont hybridees d'une part avec 
une sonde specifique des cellules non traitees et d'autre part avec une 

5 sonde specifique des cellules traitees par 0,1 M d'ethanol pendant 1 8h. 

Le profil d'hybridation differentiel obtenu et presente sur la figure 12 
permet d'apprecier la qualite de la soustraction effectuee lors de la mise en 
ceuvre de la technique DATAS. Ainsi les clones issus de I'hybridation de 
I'ARNm de cellules non traitees (NT) avec I'ADNc de cellules traitees (T r) et 

o qui doivent corresponds a des differences qualitatives specifiques de la 
situation naive hybrident preferentiellement avec une sonde representant la 
population totale des ARN messagers des cellules non traitees. 
Reciproquement, les clones issus des produits resistant a la RNase H ayant 
... _agi-sur - les_heteroduplex~ ARN(J-r)/ADNc(NT) hybrident preferentiellement 

15 avec une sonde derivee de la population totale des ARN messagers des 
cellules traitees. 

Les deux ensembles de clones specifiques d'une part de la 
situation traitee et d'autre part de la situation non traitee represented un 
exemple de banques de differences qualitatives caracteristiques de deux 

20 etats cellulaires distincts. 

4. UTILISATIONS ET APPORTS DES BANQUES DIFFERENTIELLES 
QUALITATIVES. 

25 Les possibilites d'utiiisation des banques differentielles 

d'epissage de I'invention sont illustrees notamment sur les Figures 13 a 15. 
Ainsi, ces banques sont utilisables pour : . 



30 



4. 1 . devaluation du potentiel toxique d'un compose (figure 1 3) : 

Dans cet exemple, la situation de reference est designee A et la 
situation toxique est designee B. Des abaques de toxicite sont obtenues par 
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traitement de la situation A en presence de differentes concentrations d'un 
-- compose toxique de reference, pendant des periodes variables. A differents 
points les abaques de toxicite, des banques differentielles qualitatives sont 
construites (paires de banque), dans cet exemple, des banques restreintes 

5 rA/cB et rB/cA. Les paires de banque sont avantageusement deposees sur 
un support. Le support est ensuite hybride avec des sondes issues de 
I'echantillon biologique initial traite par differentes doses de composes test : 
Produits X, Y et Z. L'hybridation est revelee et fait apparaTtre le potentiel 
toxique des produits test : dans cet exemple, le produit Z presente une forte 

10 toxicite et le produit Y offre un profil intermediaire. La faisabilite de cette 
constitution d'abaques de toxicite est bien illustree par I'exempie de 
constitution de banques de criblage differentiel qualitatif decrit ci-avant et 
mettant en jeu I'ethanol et des cellules HepG2. 



15 4.2. L'evaluation de I'efRcacite d'une composition pharmaceutique 

(figure 14) : 

Dans cet exemple, une paire de banques restreintes selon 
I'invention est realisee a partir d'un modele pathologique B et d'un modele 
sain A (ou du modele pathologique traite avec un produit actif de reference). 

20 Les banques differentielles rA/cB et rB/cA sont, le cas echeant, deposees sur 
un support. Cette paire de banque regroupe les differences d'epissage entre 
les deux situations. Cette paire de banque permet d'evaluer I'efficacite d'un 
compose test, c'est-a-dire de determiner sa capacite a generer un profit de 
type "sain" (rA/cB) a partir du profil de type pathologique (rB/cA). Dans cet 

25 exemple, la paire de banque est hybridee avec des sondes preparees a 
partir des situations A et B avec ou sans traitement par le compose test. Le 
profil d'hybridation qui peut etre obtenu est presente sur la figure 14. La 
faisabilite de cette application est la meme que celle de la constitution de 
banques de differences qualitatives caracteristiques de situations saines et 

30 toxiques presentee plus-haut. La situation toxique est remplacee par I'etat 
pathologique et il est possible d'apprecier la capacite d'un compose test a 
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produire une sonde hybridant avec plus ou moins de preference avec les 
situations de reference ou pathologique.- 

4.3. (.'anticipation de la reponse d'un echantillon pathologique a un 
5 traitement (figure 15) : 

Dans cet exemple, une paire de banque restrelnte selon 

I'invention est realisee a partir de deux modeles pathologiques, dont I'un 
repond a un traitement par un produit donne (le gene p53 sauvage par 
exemple) : situation A ; et I'autre y est refractaire : situation B. Cette paire de 
10 banque (rA/cB ; rB/cA) est deposee sur un support. 

Cette paire de banque est ensuite utilisee pour determiner la 
sensibilite d'un echantillon pathologique test a ce meme produit. Pour cela, 
cette paire de banque est hybridee avec des sondes provenant de biopsies 
de patients dont on souhaite anticiper la reponse au traitement de reference- 
is Le profil d'hybridation d'une biopsie de repondeur et d'une biopsie. de non- 
repondeur est presente sur la figure 1 5. 

4.4 ^identification de ligands pour des recepteurs orphelins 

L'activation de recepteurs membranaires ou nucleaires par 

20 leurs ligands pourrait induire specifiquement des dysregulations dans 
I'epissage de certains ARNs. L'identification de ces evenements par les 
methodes DATAS de I'invention permet de disposer d'un outil (marqueurs, 
banques, kits, etc.) de suivi d'activation de recepteurs, utilisables pour la 
recherche de ligands naturels ou synthetiques de recepteurs, en particulier 

25 orphelins. Selon cette application, des marqueurs associes aux 
dysregulations sont identifies et deposes sur des supports. L'ARN total de 
cellules, (sur)exprimant le recepteur a I'etude, traitees ou non par differentes 
compositions et/ou composes tests, est extrait et utilise comme sonde dans 
une hybridation avec les supports. La mise en evidence d'une hybridation 

30 avec certains, voire la totalite des marqueurs deposes sur le support, indique 
que le recepteur a I'etude a ete active, et done que le composition/compose 
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4.5 L'identification de cibles d'interet therapeutique : 

Celle-ci se fait par identification de genes dont I'epissage est 
modifie dans une pathologie ou dans un modeie de pathologie et plus 
precisement {'identification des exons ou introns modifies. Cette approche 
doit permettre de donner acces aux sequences qui codent ies domaines 
fonctionnels alteres lors de pathologies ou de tout phenomene 
physiopathologique adressant Ies phenomenes de proliferation, 
differentiation ou apoptose par exemple. 

Un exemple de I'apport du criblage differential qualitatif a 
l'identification de genes differentiellement episses est fourni par I'application 
de DATAS a un modeie d'induction d'apoptose par induction de I'expression 
„daJa_forma sauvage de p53._ Ce modeie cellulaire a ete etabli-paf- — 
transfection d'un systeme d'expression inductible pour le gene suppresseur 
de tumeur p53. De facon a identifier Ies differences qualitatives qui sont 
associes specifiquement a I'apoptose induite par p53, DATAS a ete mise en 
ceuvre a partir des ARN messagers extraits de cellules induites et non 
induites. Pour ces experiences 200ng d'ARN polyA+ et 200ng d'ADNc ont 
ete utilises lors de la formation des heteroduplex. Une centaine de clones, a 
ete obtenue a partir de chacune des hybridations croisees. L'hybridation de 
ces clones bacteriens puis des fragments d'ADNc qu'ils contiennent avec 
des sondes representatives des ARN messagers totaux des situations de 
depart a permis 1'identification de sequences specifiquement exprimees lors 
de la forte induction de p53 qui aboutit a la mort cellulaire (figure 16). 

Ces fragments derivent de sequences exoniques ou introniques qui 
modulent la qualite du message present et permettent de proposer Ies 
domaines fonctionnels auxquels ils participent ou qu'ils interrompent comme 
des cibles d'intervention pour induire ou inhiber la mort cellulaire. 

Une telle approche aboutit egalement a la constitution d'une paire de 
banques qui rassemblent des evenements differentiellement episses entre 
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une situation non apoptotique et une situation apoptotique. Cette paire de 
banque peut etre utilisee pour tester le pouvoir hybridant d'une sonde - 
derivee d'une autre situation physiopathologique ou d'un traitement 
particulier. Le resultat d'une telle hybridation donnera des indications sur 
5 I'engagement eventuel du programme d'expression genetique de la situation 
testee vers I'apoptose. 

Comme il ressort de la description ci-avant, Pinvention conceme 

egalement : 

10 - toute sonde nucleique, tout oligonucleotide, tout anticorps 
dirige contre une sequence identifiee par la technique decrite dans la 
presente demande et caracterises en ce qu'ils permettent de caracteriser 
une situation pathoiogique, 
=_ Putilisation des informations - issues de ('utilisation des- — 

15 techniques decrites pour la recherche de molecules organiques a visee 
therapeutique par la mise en place de criblages caracterises en ce qu'ils 
ciblent des domaines splices differentiellement entre une situation saine et 
une situation pathoiogique ou bien caracterises en ce qu'ils sont bases sur 
I'inhibition des gains de fonctions acquis par la proteine resultant d'un 

20 epissage differentiel, 

- ('utilisation des informations issues des techniques decrites 
dans la presente demande pour des applications de therapie genique, 

- I'utilisation d'ADNc transferes par therapie genique 
caracterises en ce qu'ils ont des proprietes antagonistes ou agonistes sur 

25 des voies de signalisation cellulaires definies, 

- toute constitution et toute utilisation de banques moleculaires 
d'exons ou d'introns alternatifs a des fins: 

. de diagnostic ou de reactifs commerciaux pour la 

recherche 

30 . de creer ou de rechercher des molecules, polypeptides, 

acides nucleiques pour application therapeutique. 
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- toute constitution et toute utilisation de banques virtuelles 
informatiques regroupant des exons~ou introns alternatifs caracterises en ce 
que ces banques permettent de concevoir des sondes nucleiques ou des 
amorces oligonucleotidiques dans le but de caracteriser les epissages 

5 alternatifs qui differentient deux etats physiopathologiques distincts. 

- toute composition pharmaceutique ou diagnostique 
comprenant des polypeptides, acides nucleiques sens ou anti-sens, ou des 
molecules chimiques capables d'interferer avec les produits d'epissage 
alternatifs mis en evidence et clones par les techniques de I'invention, 

10 toute composition pharmaceutique ou diagnostique 
comprenant des polypeptides, acides nucleiques sens ou anti-sens, ou des 
molecules chimiques capables de restaurer un epissage representatifs d'une 
situation normale par opposition a Pevenement altematif caracteristique d'une 
-situation pathologique, 

15 

5. DEREGULATIONS DES MECANISMES D'EPISSAGE DES ARNS 
PAR DES AGENTS TOXIQUES. 



Cet exemple montre que les differences de formes et/ou profils 
20 d'epissages peut etre utilisee comme marqueur pour le suivi et/ou la 
detection de toxicite et/ou d'efficacite de composes. 

Les effets d'agents toxiques sur les deregulations d'epissages des 
ARNs a ete teste de la maniere suivante. Des cellules hepatocytaires, 
HepG2, ont ete traitees par differentes doses de trois composes toxiques 
25 (ethanol, camptothecine, PMA (Phorbol 12-Myristate 1 3-Acetate)). Deux 
tests de cytotoxicite (Bleu de Trypan, MTT) ont ete realises a differents 
temps : 4h et 18h pour I'ethanol ; 4h et 18h pour la camptothecine ; 18h et 
40h pour le PMA. 

Le Bleu de Trypan est un colorant qui peut etre incorpore par les 
30 cellules vivantes. Un simple comptage des cellules "bleues" et "blanches" 
sous microscope permet de determiner le pourcentage de cellules vivantes 
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apres traitement .ou pourcentage de survie. Les points sont effectues en 

-triplicates. - - 

Le test MTT est un test colorimetrique qui mesure ia capacite des 
cellules vivantes a convertir les sels solubles de tetrazolium (MTT) en un 

5 precipite insoluble de formazan. Ces cristaux de formazan, bleu fonce, 
peuvent etre dissous et leur concentration determinee par mesure 
d'absorbance a 550 nm. Ainsi, apres ensemencement de plaques 24 puits 
par 150000 cellules sur la nuit, puis traitement des cellules par les composes 
toxiques, est ajoute 50 pi de MTT (Sigma) (a 5 mg/ml dans du PBS). La 

10 reaction de formation des cristaux de formazan s'effectue en 5 h dans 
I'incubateur a C02 (37°C, 5% C02, 95% humidite). Apres addition de 500 pi 
de solution de solubilisation (Hcl 0,1 N dans Isopropanol-Triton X-100 (10%)), 
les cristaux sont dissous sous agitation et les absorbances mesurees a 550 a 
660rm..Les points sont effectues en triplicates avec les controles (viability 

15 mort cellulaire, blancs) appropries. 

Un test d'apoptose ou mort cellulaire programmee a egalement ete 
realise par mesure de la fragmentation d'ADN via ('utilisation d'anticorps anti- 
histone et de mesures d'ELISA. Le test utilise est Cell Death ELISA Plus de 
Roche. 

20 Les resultats de ces trois tests (Figures 18 A,B,C) ont permis de 

determiner que les doses suivantes : 

• ethanol : 0,1 M 

• camptothecine : 1 ug/ml 
25 • PMA : 50 ng/ml 

etaient bien inferieures aux IC50s mesurees. 

Les cellules HepG2 ont ainsi ete traitees par ces trois composes a ces 
trois doses pendant 4 h pour Tethanol et la camptothecine et 18 h pour le 
PMA. Les ARNs messagers ont ete purifies par billes Dynaj-Oligo-(dT) a 
30 partir d'ARNs totaux purifies selon le kit Rneasy (Quiagen). Des syntheses 
d'ADNc ont ete effectuees a partir de ces ARNs messagers et de la 



WO 99/46403 1 «™" raM ' 

Best Available Copy 77 

Transcriptase Inverse Superscript (Life Technologies) en utilisant des 
hexameres aleatoires comme amorces. 

Ces premiers brins ont servi de matrices a des reactions 
d'amplification par PCR (94°C 1mn, 55°C 1mn, 72°C 1mn, 30 cycles) a I'aide 
s des amorces oligonucleotidiques suivantes : 

MACH-a: 

5'-TGCCCAAATCAACAAGAGC-3' (SEQ ID NO: 11) 
10 S'-CCCCTGACAAGCCTGAATA-S' (SEQ ID NO: 12) 

Ces amorces correspondent a des regions communes aux differentes 
isoformes decrites de MACH-a (1 ,2 et 3, ampiifiant respectivement 595, 550 

et 343 paires de bases). MACH-a (Caspase-8) est une- protease impliqu6e 

15 dans la mort cellulaire programmee (Boldin et.al., Cell (1996), 85, 803-815). 

BCL-X : 

5' ATGTCTCAGAGCAACCGGGAGCTG 3' (SEQ ID NO: 13) 
20 5' GTGGCTCCATTCACCGCGGGGCTG 3' (SEQ ID NO: 14) 

Ces amorces correspondent a des regions communes aux differentes 
isoformes decrites de bcl-X (bcl-XI, bcl-Xs, BCL-XB) (Boise et al., Cell (1993) 
74, 597-608; U72398 (Genbank)) et doivent amplifier un fragment unique 
25 pour ces trois isoformes de 204 paires de bases. 

FASR: 



30 



5'-TGCCAAGAAGGGAAGGAGT-3' (SEQ ID NO: 15) 
5'-TGTCATGACTCCAGCAATAG-3' (SEQ ID NO: 16) 
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Ces amorces correspondent a des regions communes a certaines 
isoformes de FASR et doivent amplifier un fragment de 478 paires de bases 
pour ia forme sauvage de FasR, 452 pour I'isoforme A8 et 415 pour 
5 I'isoforme ATM. 

Les resultats rapportes sur la figure 1 9 indiquent que : 

• la camptothecine induit une diminution de I'expression de risoforme 
MACH-a1 et une augmentation de I'isoforme MACH-a3. 

10 • La camptothecine induit I'apparition d'une nouvelle isoforme de bcl-X 

(bande superieure du doublet migrant vers 200 paires de bases). 

• La camptothecine induit une diminution de la forme sauvage du 
recepteur de fas, remplace par une expression d'une isoforme plus courte 

— pouvant corFespendfe-a-Fae-AT-M^ - 

15 • L'ethanol induit la disparition de bcl-x, remplace par une isoforme 

plus courte. 

• L'ethanol induit une augmentation de la forme longue, sauvage, du 
recepteur de fas, ceci aux depens de risoforme plus courte. 

20 Ces resultats demontrent que des traitements par des agents toxiques 

a des doses faibles peuvent induire des dysregulations d'epissages 
alternatifs de certains ARNs, ceci de facon specifique. L'identification de ces 
dysregulations au niveau post-transcriptionnel, notamment par ('application 
de la technologie DATAS permet ainsi de definir un outil predictif de la 

25 toxicite de molecules. 
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frgVENDICATIQNS 

1. Procede d'identification et/ou de clonage de regions d'acides 
nucleiques representatives de differences genetiques qualitatives entre deux 
5 echantillons biologiques, comprenant une etape d'hybridation d'une 
population d'ARN ou d'ADNc double-brin provenant d'un premier echantillon 
biologique avec une population d'ADNc provenant d'un deuxieme echantillon 
biologique. 



10 2. Procede selon la revendication 1 caracterise en ce qu'il comprend : 

(a) Phybridation des ARN provenant du premier echantillon 
(situation test) avec les ADNc provenant du deuxieme echantillon (situation 
de reference); 

— -(b) Phy bridation des ARN- provenant du deuxieme -echantillon 

15 (situation de reference) avec les ADNc provenant du premier echantillon 

(situation test); et 

(c) ('identification et/ou le clonage, a partir des hybrides formes 

en (a) et (b), d'acides nucleiques correspondent a des differences genetiques 

qualitatives. 

20 

3. Proc6d6 selon la revendication 1 ou 2 caracterise en ce que les 
hybridations sont realisees entre une population d'ARN et des ADNc simple- 
brins et en ce qu'il comprend ^identification et/ou le clonage de regions 
d'ARN non appariees. 

25 

4. Procede selon la revendication 1 ou 2 caracterise en ce que les 
hybridations sont realisees entre une population d'ARN et des ADNc double- 
brins et en ce qu'il comprend Pidentification et/ou le clonage de regions 
d'ADN appariees. 

30 

5. Proc6d6 selon la revendication 1 caracterise en ce qu'il comprend 
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I'hybridation entre une population d'ADNc double-brin provenant d'un premier 
Echantillon biologique et une population d'ADNc simple-brin provenant d'un 
deuxieme echantillon biologique. 

5 6. Precede selon I'une des revendications 1 a 5 caracterise en ce que 

I'echantillon biologique est compose de cellules, d'un tissu, d'un organe ou 
d'une biopsie. 

7. Procede selon I'une des revendications 1 a 6 pour Identification 
10 et/ou le clonage d'epissages alternatifs differentiels entre des cellules 

tumorales et des cellules non-tumorales. 

8. Procede selon I'une des revendications 1 a 6 pour I'identification 

— .et/ou le clonage d'epissages alternatifs differentiels entre des cellules-traitees 

is par un compose test et des cellules non-traitees. 

9. Procede selon I'une des revendications 1 a 6 pour I'identification 
et/ou le clonage d'epissages alternatifs differentiels entre des cellules en 
apoptose et des cellules non-apoptotiques. 

20 

10. Proced6 selon I'une des revendications 1 a 9 caracteris6 en ce 
que I'hybridation est realisee en phase liquide. 

11. Procede d'identification et/ou de clonage de regions d'acides 
25 nucleiques epissees differentiellement entre deux situations physiologiques A 

et B, comprenant : 

(a) la formation d'heteroduplex en phase liquide entre les ARN 
messagers provenant de la situation A et les ADNc provenant de la situation 
B d'une part; 

30 (b) la formation d'heteroduplex en phase liquide entre les ARN 

messagers provenant de la situation B et les ADNc provenant de la situation 
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A d'autre part; et 

(c) I'identification et/ou le clonage des regions d'ARN non 
appariees dans ies heteroduplex obtenus en (a) et en (b). 

5' .12. Procede d'identification et/ou de clonage de regions d'acides 
nucieiques epissees differentiellement entre deux situations physiologiques A 
et B, comprenant : 

(a) la formation d'heteroduplex entre Ies ARN messagers 
provenant de la situation A et Ies ADNc provenant de la situation B d'une 

10 part, Ies ARN ou Ies ADNc etant immobilises sur un support ; 

(b) la formation d'heteroduplex entre Ies ARN messagers 
provenant de la situation B et Ies ADNc provenant de la situation A d'autre 
part, Ies ARN ou Ies ADNc etant immobilises sur un support ; et 

(c) I'identification et/ou le -clonage des -regions d'ARN non 

15 appariees dans Ies heteroduplex obtenus en (a) et en (b). 

13. Composition comprenant Ies acides nucieiques identifies et/ou 
clones selon Ies precedes des revendications 1 a 12. 

20 14. Composition d'acides nucieiques, caracterisee en ce qu'elle 

comprend essentiellement Ies acides nucieiques representatifs d'alterations 
genetiques qualitatives, notamment des epissages alternatifs distinguant 
deux situations physiologiques d'une cellule ou d'un tissu. 

25 15. Composition selon Ies revendications 13 ou 14 caracterisee en ce 

que Ies acides nucieiques sont clones dans des vecteurs. 

16. Banque d'acides nucieiques comprenant des acides nucieiques 
specifiques d'alterations genetiques qualitatives, notamment d'epissages 
30 alternatifs distinguant deux situations physiologiques d'une cellule ou d'un 
tissu. 
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_-.-17. Banque selon la revendication 16, caracterisee en ce qu'il s'agit 

d'une banque restreinte aux epissages altematifs qui caracterisent les ARN 
matures. 

5 

18. Banque selon la revendication 16, caracterisee en ce qu'il s'agit 
d'une banque complexe des epissages altematifs qui caracterisent les 
transcrits. 

10 19. Banque selon la revendication 16, caracterisee en ce qu'il s'agit 

d'une banque autologue caracteristique des epissages altematifs entre les 
ARN matures et premessagers d'une situation physiologique. 

; 20. Banque d'acides nucleiques-comprenant-des-oligonucleotides-ou- - -- 

15 des fragments PCR specifiques d'epissages altematifs distinguant deux 
situations physiologiques. 

21. Banque de microorganismes comprenant des microorganismes 
transformes par des acides nucleiques specifiques d'epissages altematifs 

20 distinguant deux situations physiologiques d'une cellule ou d'un tissu. 

22. Banque selon les revendications 16 a 21 caracterisee en ce qu'elle 
est deposee sur un support. 

25 23. Kit comprenant un support sur lequel est depose une banque 

selon Tune des revendications 16 a 21. 

24. Kit selon la revendication 23 caracterise en ce qu'il comprend deux 
banques selon I'une des revendications 16 a 21, deposee sur un meme 
30 support ou sur deux supports distincts. 
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25. Kit selon les revendications 23 ou 24 caracterise en ce que le 
support.est-compose d'un filtre, membrane ou d'une puce. 

26. Utilisation d'une composition selon Tune des revendications 13 a 
s 15 ou d'une banque selon les revendications 16 a 21 pour 1'identification de 

molecules actives. 



27. Utilisation d'une composition selon Tune des revendications 13 a 
15 ou d'une banque selon les revendications 16 a 21 pour ('identification de 

10 proteines ou domaines proteiques affectes dans une pathologie. 

28. Utilisation d'une composition selon I'une des revendications 13 a 
15 ou d'une banque selon les revendications 16 a 21 pour Pidentification de 
rinmainps antig^nigufts ftp6r.ifiqi)f>s de~ proteines impliquees— da ns une 

15 pathologie. 

29. Methode d'identification et/ou de production de proteines ou 
domaines proteiques impliques dans une pathologie comprenant : 

(a) I'hybridation des ARN messagers d'un echantillon 
20 pathologique avec les ADNc d'un echantillon sain, ou I'inverse, ou les deux 

en parallele, 

(b) I'identification, dans des hybrides formes, des regions 
correspondant aux differences qualitatives specifiques de I'etat pathologique 
par rapport a I'etat sain, 

25 (c) I'identification et/ou la production d'une proteine ou domaine 

proteique correspondant a une region identifiee en (b). 

30. Precede d'identification et/ou de clonage de genes suppresseurs 
de tumeurs ou d'epissages au sein de genes suppresseurs de tumeurs, 

30 comprenant : 

(a) I'hybridation des ARN messagers d'un echantillon de tumeur 
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avec les ADNc d'un echantillon sain, ou I'inverse, ou les deux en parallele, 

(b) ridentification r dans les hybrides formes, des regions 
correspondant aux differences quaiitatives specifiques de I'echantillon 
tumoral par rapport a i'etat sain, 
5 (c) {'identification et/ou la production d'une proteine ou domaine 

proteique correspondant a une region ident'rfiee en (b). 

31 . Composition comprenant un compose capable d'interferer avec les 
produits d'epissages altematifs identifies selon le precede des revendications 

10 1 a 12. 

32. Proteine susceptible d'etre identifiee par le precede de la 
revendication 29. 



is 33. Utilisation d'une banque selon les revendications 16 a 21 ou d'un 

kit selon les revendications 23 a 25 pour evaluer la toxicite d'un compose. 

34. Procede d'identification et/ou de clonage d'acides nucleiques 
specifique d'un etat toxique d'un echantillon biologique donne comprenant la 
20 preparation de banques differentielles quaiitatives entre les ARN et les ADNc 
de I'echantillon apres ou sans traitement par un compose toxique test, et la 
recherche de marqueurs de toxicite specifiques des qualites de I'echantillon 
apres traitement. 

25 35. Procede de determination ou devaluation de la toxicite d'un 

compose test sur un echantillon biologique donne comprenant I'hybridation : 

- de banques differentielles entre les ADNc et les ARN dudit 
echantillon biologique a I'etat sain et a un ou differents stades de toxicite 
resultant d'un traitement dudit echantillon avec un compose toxique de 

30 reference, avec, 

- une preparation d'acides nucleiques de I'echantillon biologique 
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traits par ledit compose test, et 

Evaluation du potentiel toxique du compose test par analyse 

du degre d'hybridation avec les differentes banques. 

5 36. Procede selon la revendication 35 caracterise en ce que 

I'echantillon biologique est une culture d'hepatocytes, de cellules epitheliales 
renales ou de cellules endothelials, traitee ou non par un agent toxique, de 
preference I'ethanol. 

io 37. Procede selon la revendication 35 caracterise en ce que 

I'echantillon biologique est une culture de peau traitee ou non par des agents 
toxiques ou irritants. 

„. 38,-Utilisation-d'une banque selon les -revendications 16 a 21 ou d'un - 

15 kit selon les revendications 23 a 25 pour evaluer I'efficacite d'un compose. 

39. Procede de determination ou devaluation de I'efficacite 
therapeutique d'un compose test sur un echantillon biologique donne 
comprenant Phybridation : 

20 - de banques differentiates entre les ADNc et les ARN dud.it 

echantillon biologique a I'etat sain et a I'etat pathologique avec, 

- une preparation d'acides nucleiques de I'echantillon biologique 
traite par ledit compose test, et 

- revaluation du potentiel therapeutique du compose test par 
25 analyse du degre d'hybridation avec les differentes banques. 

40. Utilisation d'une banque selon les revendications 16 a 21 ou d'un 
kit selon les revendications 23 a 25 pour evaluer la reponse d'un echantillon 
pathologique a un compose. 

30 

41. Procede de determination ou devaluation de la reponse d'un 
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patient a un compose ou traitement test comprenant I'hybridation : 

-de banques differentielles entre les ADNc et les ARN d'un 
echantillon biologique repondeur audit compose/traitement et d'un 
echantillon biologique non-repondeur ou mal-repondeur audit 
5 compose/traitement, avec, 

- une preparation d'acides nucleiques d'un echantillon 
biologique pathologique du patient, et 

- revaluation du potentiel repondeur du patient par analyse du 
degre d'hybridation avec les differentes banques. 

io 

42. Procede selon la revendication 41 pour la determination ou 
revaluation de la reponse d'un patient a un compose ou traitement 
antitu moral. 

15 43. Procede selon la revendication 42 pour la determination ou 

revaluation de la reponse d'un patient a un traitement antitumoral par 
transfert du gene p53 sauvage. 

44. Acide nucleique susceptible d'etre identifie par le procede selon 
20 les revendications 1 a 12. 

45. Utilisation d'un acide nucleique selon la revendication 44 pour la 
detection d'anomalies genetiques dans un echantillon. 

25 46. Utilisation d'un compose selon la revendication 28 pour la 

detection d'une anomalie genetique dans un echantillon. 

47. Anticorps dirige contre une proteine ou un domaine proteique tel 
que defini dans la revendication 27 ou 28. 

30 

48. Proteine ASHC de sequence SEQ ID NO: 9. 
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FCT/r K9f/UW54 / 



49. Sonde nucleique, oligonucleotide ou anticorps permettant d'identifier la 
proteine ASHC selon la revendication 48 ou son acide nucleique, et/ou une 
alteration du rapport SHC/ASHC dans un echantillon biologique. 

5' 

50. Procede de criblage caracterise en ce qu'il est base sur le blocage du 
domaine episse dans la proteine SHC ou sur le blocage des gains de fonction 
acquis par la proteine epissee A SHC. 

io 51. Vecteur comprenant une sequence codant pour la proteine ASHC 

selon la revendication 48. 

52. Procede selon les revendications 3, 4 ou 5 caracterise en ce que 

le clonage des acides-nucleiques-comprend la-transcription inverse et/ou 

15 ('amplification au moyen d'amorces aleatoires ou semi-aleatoires, en 
particulier d'amorces de sequence SEQ ID NO: 3 dans laquelle N indique 
que chacune des quatre bases peut etre presente de facon aleatoire a la 
position indiquee, W, X et Y designent chacun une base determinee, et Z 
designe soit une base determinee, soit un groupe 3-OH. 

20 

53. Oligonucleotide comprenant, dans Porientation 5' — > 3' : 

- une zone stabilisatrice comprenant 8 a 24 nucleotides determines, 

- une region aleatoire comprenant de 3 a 8 nucleotides, et 

- une zone minimale d'amorcage comprenant 2 a 4 nucleotides 
25 definis. 

54. Oligonucleotide de sequence SEQ ID NO: 3 dans laquelle : 

- N indique que chacune des quatre bases peut etre presente 
de facon aleatoire a la position indiquee; 

- W, X et Y designent chacun une base determinee, 

30 - Z designe soit une base determinee, soit un groupe 3'-OH. 
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55. Banque. d'ADN genomique caracterisee en ce qu'elle est 
constitute de fragments d'ADN genomiques de faille inferieure ou egale a 1 
kb environ. 

5 

56. Methode de detection ou de suivi du potentiel toxique et/ou 
therapeutique d'un compose, basee sur ia detection de formes et/ou de 
profils d'epissages induits par ce compose sur un echantillon biologique. 

10 57. Utilisation, comme source de marqueurs de pharmacogenomique, 

(i) de rintervariabilite, entre individus, d'isoformes generees par epissage 
altematif (analyse du spliceome) ou (ii) de modifications d'epissage induites 
par des traitements. 
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ECHANTILLON 1 ECHANTILLON 2 

ARN 
ADNc SB 
k ADNc DB 



1 . -> HETERODUPLEXES ARN/ADNC SB 

2. -> HETEROTRIPLEXES ARN/ADNC DB 
3,4. -> HOMODUPLEXES ADN/ADN 



ARN 




HYBRIDATION 



FIGURE 1A 
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ECHANTILLON TEST 
(B) 



ECHANTILLON REFERENCE 
(A) 



ARN ARN 




HYBRIDATION 



ARN (B) / ADNc (A) 



POPULATION 

D'ACIDES NUCLEIQUES CARACTERISTIQUES 
DE SITUATION (B) PAR RAPPORT A SITUATION (A) 



FIGURE 1 B 
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ECHANTILLON TEST 
(B) 



ARN (B) 



ADNC (B) 



ECHANTILLON REFERENCE 
(A) 




ARN (A) 



ADNC (A) 



HYBRIDATION HYBRIDATION 



ARN (A) / ADNC (B) ARN (B) / ADNC (A) 



POPULATION 2 

acides nucleiques 
caracteristiques des 
differences qualitatves 
de (a) par rapport a (b) 



POPULATION 1 

acides nucleiques 
caracteristiques des 
differences qualitatives 
de (b) par rapport a (a) 



FIGURE 1 C 
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PCT/FKyy/UU547 



ARN(mA) 
EchantQloii pathologique 



ARN (mB) 
Echantillon normal 



c 
A 



ADN compl&nentaire 

cB 





I 



Hybrides ARN,^, / cDNA wr/mi/ (mA/cB) 



4 



FIGURE 2 
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Hybrides ARN pa(ho I cDNA w „ rmfl , 
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Sequence non epissee apres digestion a la RNaseH 



=====: 



Sequence recherchee marquee en 5' et 3* 
a l'aide de deux oligonucleotides 



i 



Fragment amplifie par PCR 



tun"— 



Clonage ct sequcncage 
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RNA (mA) 
Echantillon normal 



RNA (mB) 
Echantillon pathologique 



I 



synthase des ler et 2eme brins d'ADNc 



Hybridation du double brii^) avec 
TARN mB en presence de formamide 



R-loop 




+ glyoxal 




- formamide 
RNaseH, 



FIGURE 5 
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s 1 nuclease 
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B Situations A et B 



ARNm 

ler brins d 'ADNc 
de A et de B 

2eme brin d 'ADNc de A 




Hybridations des 2 brins 
de A avec le leTtnin rde B 



Digestion par Sau3AI 



Separation des boucles engagees en duplex 



Adjonction de linkers aux sites Sau3AI 



Amplification par PCR puis clonage 

EJOIJRE 6A 
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Exons ou introns alternatif de la situation A 

et de la situation B 




I J 




Sequences de jonction 



Sequences flanquantes 



figure ffi 
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Pathologie 




Diagnostics 



Target for 




cDNA pour 
Th6rapie 

Therapeutic Intervention GSnique 



Criblage haut flux 

9 



Candidal 




Drogue 




Profil Toxicologique 

(genotoxicit£) 

Signature d'efficacite 
(genopharmacologie) 
Mecanisme d'action 



Pharmacogenomique 



FIGURE 7 
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A) 

1 2 3 




B) 



1 2 3 4 5 6 7 8 9 10 11 12 




Figure 1 1 
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Construction de banques diffeYentielles qualitatives a differents points 
des abaques de toxicite 
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Hybridation avec des sondes issues du modele initial 



trait e par differents produits 




produitX QQ 


00 


00 


00 


produitY QO 


00 


00 


00 


produitZ 


00 


00 


00 



FIGURE 13 



WO 99/46403 





18/26 




Support 


f o o\ 


1- 


/ 0 « o\ 
I oo 




v°° y 


x ^ 


rA/cB 


rB/cA 




HYBRIDATION 



sans produit : 



sonde A 




sonde B 




avec produit efficace: 



sonde A 
sonde B 

FIGURE 14 
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HYBRIDATION 



biopsie de repondeurs: 




biopsies de non repondeurs: 




FTGIJRE 15 




FEUILLE DE REMPLACEMENT (REGLE 26) 
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Sequence peptidique de ASHC (SEQ ID WO: 9) 

l 

MNKLSGGGGR RTRVEGGQLG GEEWTRHGSF VNKPTRGWLH PNDKVMGPGV 
SYLVRYMGCV EVLQSMRALD FNTRTQVTRE AISLVCEAVP GAKGATRRRK 
PCSRPLSSIL GRSNLKFAGM PITLTVSTSS LNLMAADCKQ IIANHHMQSI 
SFASGGDPDT AEYVAYVAKD PVNQRACHIL ECPEGLAQDV ISTIGQAFEL 
RFKQYLRNPP KLVTPHDRMA GFDGSAWDEE EEEPPDHQYY NDFPGKEPPL 
GGWDMRLRE GAAPGAARPT APNAQTPSHL GATLPVGQPV GGDPEVRKQM 
PPPPPCPGRE LFDDPSYVNV QNLDKARQAV GGAGPPNPAI NGSAPRDLFD 
MKPFEDALRV PPPPQSVSMA EQLRGEPWFH GKLSRREAEA LLQLNGDFLV 
RTKDHRFESV SHLISYHMDN HLPIISAGSE LCLQQPVERKL 

441 



Sequence nuclejque de ASHC (SEQ ID NO: 10) 



atgaacaagc 


tgagtggagg 


cggcgggcgc 


aggactcggg 


tggaaggggg 


50 


ccagcttggg 


ggcgaggagt 


ggacccgcca 


cgggagcttt 


gtcaataagc 


100 


ccacgcgggg 


ctggctgcat 


cccaacgaca 


aagtcatggg 


acccggggtt 


150 


tcctacttgg 


ttcggtacat 


gggttgtgtg 


gaggtcctcc 


agtcaatgcg 


200 


tgccctggac 


ttcaacaccc 


ggactcaggt 


caccagggag 


gccatcagtc 


250 


tggtgtgtga 


ggctgtgccg 


ggtgctaagg 


gggcgacaag 


gaggagaaag 


300 


ccctgtagcc 


gcccgctcag 


ctctatcctg 


gggaggagta 


acctgaaatt 


350 


tgctggaatg 


ccaatcactc 


tcaccgtctc 


caccagcagc 


ctcaacctca 


400 


tggccgcaga 


ctgcaaacag 


atcatcgcca 


accaccacat 


gcaatctatc 


450 


tcatttgcat 


ccggcgggga 


tccggacaca 


gccgagtatg 


tcgcctatgt 


500 


tgccaaagac 


cctgtgaatc 


agagagcctg 


ccacattctg 


gagtgtcccg 


550 


aagggcttgc 


ccaggatgtc 


atcagcacca 


ttggccaggc 


cttcgagttg 


600 


cgcttcaaac 


aatacctcag 


gaacccaccc 


aaactggtca 


cccctcatga 


650 


caggatggct 


ggctttgatg 


gctcagcatg 


ggatgaggag 


gaggaagagc 


700 


cacctgacca 


tcagtactat 


aatgacttcc 


cggggaagga 


accccccttg 


750 


gggggggtgg 


tagacatgag 


gcttcgggaa 


ggagccgctc 


caggggctgc 


800 


tcgacccact 


gcacccaatg 


cccagacccc 


cagccacttg 


ggagctacat 


850 


tgcctgtagg 


acagcctgtt 


gggggagatc 


cagaagtccg 


caaacagatg 


900 
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ccacctccac 


caccctgtcc 


aggcagagag 


ctttttgatg 


atccctccta 


950 


tgtcaacgtc 


cagaacctag 


acaaggcccg 


gcaagcagtg 


ggtggtgctg 


1000 


ggccccccaa 


tcctgctatc 


aatggcagtg 


caccccggga 


cctgtttgac 


1050 


atgaagccct 


tcgaagatgc 


tcttcgggtg 


cctccacctc 


cccagtcggt 


1100 


gtccatggct 


gagcagctcc 


gaggggagcc 


ctggttccat 


gggaagctga 


1150 


gccggcggga 


ggctgaggca 


ctgctgcagc 


tcaatgggga 


cttcttggtt 


1200 


cggactaagg 


atcaccgctt 


tgaaagtgtc 


agtcacctta 


tcagctacca 


1250 


catggacaat 


cacttgccca 


tcatctctgc 


gggcagcgaa 


ctgtgtctac 


1300 


agcaacctgt 


ggagcggaaa 


ctgtga 






1326 
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Bleu Trypan HepG2 / Ethanol 

% cellules vivantes 




Test MTT 



% cellules vivantes 




Test ELISA de fragmentation de I'ADN 



Facteur d'enrichissement 

20 




| 4h 



0 0.01 0.1 1 M 
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Bleu Trypan 



HepG2 / Camptothecin 



% cellules vivantes 

100 



if K fc £ 


I 9 

II 
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■ 
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■ 
1 
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1 


1 1 



Test MTT 



% cellules vivantes 




0 0.01 0.1 1 10 20 

Test ELISA de fragmentation de I'ADN 

Facteur d'enrichissement 

8 




B 4h 

k 18h 



0.01 0.1 1 10 20 |ig/ml 



|4h 

I18h 

yir.TTRE 18B 



ug/ml 



4h 



0.01 0.1 



10 fig/ml 
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Bleu Trypan 



HepG2 / PMA 



cellules vivantes 




40 _ 



20 _| 



llll 



Test MTT 




20 _| 



1111 
III I 



I I 



Test ELISA de fragmentation de PADN 



Facteur d'enrichissement 




1 18h 
40h 



0 0.01 0.05 0.5 5 50 Ug/ml 



% cellules vivantes 



l18h 

»40h 



0 0.01 0.05 0.5 5 50 P& ml 



18h 



0 0.01 0.05 0.5 5 50 pg/ml 
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LISTE DE SEQUENCES 

<110> EXONHIT THERAPEUTICS SA 

<12 0> CRIBLAGE DIFFERENT I EL QUALITATIF 

<130> B3898B - PB/KM 

<140> 
<141> 

<150> 9802997 
<151> 1998-03-11 

<160> 16 

<170> Patentln Ver. 2.1 

<210> 1 
<211> 23 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: OLIGO 
<400> 1 

gagaagcgtt atnnnnnnna ggn 23 

<210> 2 
<211> 24 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: OLIGO 
<400> 2 

gagaagcgtt atnnnnnnnn tccc 24 

<210> 3 
<211> 23 
<212> ADN 

<213> Sequence artificielle 



<220> 



WO *W4041U 



<223> Description de la sequence 
<400> 3 

gagaagcgtt atnnnnnnnn nnn 

<210> 4 
<211> 20 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence 
<400> 4 

gagaagcgtt atnnnnncca 

<210> 5 

<211> 66 

<212> ADN 

<213> Homo sapiens 

<400> 5 

ccacacctgg ccagtatgtg ctcactggct 
cactgg 

<210> 6 
<211> 23 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence 
<400> 6 

gggacctgtt tgacatgaag ccc 

<210> 7 
<211> 22 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence 



2 

artificielle : OLIGO 

23 



artificielle: OLIGO 

20 



tgcagagtgg gcagccagcc taagcatttg 60 

66 



artificielle: OLIGO 

23 



artificielle : OLIGO 



<400> 7 

cagtttccgc tccacaggtt gc 



22 



wu yy/4Mu^ 
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<210> 8 
<211> 96 
<212> ADN 

<213> Homo sapiens 
<400> 8 

gtacgggaga gcacgaccac acctggccag tatgtgctca ctggcttgca gagtgggcag 60 
cctaagcatt tgctactggt ggaccctgag ggtgtg 96 

<210> 9 

<211> 441 

<212> PRT 

<213> Homo sapiens 



<400> 9 

Met Asn Lys Leu Ser Gly Gly Gly Gly Arg Arg Thr Arg Val Glu Gly 
1.5 10 15 

Gly Gin Leu Gly Gly Glu Glu Trp Thr Arg His Gly Ser Phe Val Asn 
20 25 30 

Lys Pro Thr Arg Gly, Trp Leu His Pro Asn Asp Lys Val Met Gly Pro 
35 40 45 

Gly Val Ser Tyr Leu Val Arg Tyr Met Gly Cys Val Glu Val Leu Gin 
50 55 60 

Ser Met Arg Ala Leu Asp Phe Asn Thr Arg Thr Gin Val Thr Arg Glu 
65 70 75 80 

Ala He Ser Leu Val Cys Glu Ala Val Pro Gly Ala Lys Gly Ala Thr 
85 90 95 

Arg Arg Arg Lys Pro Cys Ser Arg Pro Leu Ser Ser He Leu Gly Arg 
100 105 110 

Ser Asn Leu Lys Phe Ala Gly Met Pro He Thr Leu Thr Val Ser Thr 
115 120 125 

Ser Ser Leu Asn Leu Met Ala Ala Asp Cys Lys Gin He lie Ala Asn 
130 135 140 

His His Met Gin Ser He Ser Phe Ala Ser Gly Gly Asp Pro Asp Thr 
145 150 155 160 

Ala Glu Tyr Val Ala Tyr Val Ala Lys Asp Pro Val Asn Gin Arg Ala 
165 170 175 



Cys His He Leu Glu Cys Pro Glu Gly Leu Ala Gin Asp Val He Ser 
180 185 190 



Thr He Gly Gin Ala Phe Glu Leu Arg Phe Lys Gin Tyr Leu 
195 200 205 



Arg Asn 
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Pro Pro Lys Leu Val Thr Pro His Asp Arg Met Ala Gly Phe Asp Gly 
210 215 220 

Ser Ala Trp Asp Glu Glu Glu Glu Glu Pro Pro Asp His Gin Tyr Tyr 
225 230 235 240 

Asn Asp Phe Pro Gly Lys Glu Pro Pro Leu Gly Gly Val Val Asp Met 
245 250 255 

Arg Leu Arg Glu Gly Ala Ala Pro Gly Ala Ala Arg Pro Thr Ala Pro 
260 265 270 

Asn Ala Gin Thr Pro Ser His Leu Gly Ala Thr Leu Pro Val Gly Gin 
275 280 285 

Pro Val Gly Gly Asp Pro Glu Val Arg Lys Gin Met Pro Pro Pro Pro 
290 295 300 

Pro Cys Pro Gly Arg Glu Leu Phe Asp Asp Pro Ser Tyr Val Asn Val 
305 310 315 320 

Gin Asn Leu Asp Lys Ala Arg Gin Ala Val Gly Gly Ala Gly Pro Pro 
325 330 335 

Asn Pro Ala lie Asn Gly Ser Ala Pro Arg Asp Leu Phe Asp Met Lys 
340 345 350 

Pro Phe Glu Asp Ala Leu Arg Val Pro Pro Pro Pro Gin Ser Val Ser 
355 360 365 

Met Ala Glu Gin Leu Arg Gly Glu Pro Trp Phe His Gly Lys Leu Ser 
370 375 380 

Arg Arg Glu Ala Glu Ala Leu Leu Gin Leu Asn Gly Asp Phe Leu Val 
385 390 395 400 

Arg Thr Lys Asp His Arg Phe Glu Ser Val Ser His Leu lie Ser Tyr 
405 410 415 

His Met Asp Asn His Leu Pro lie lie Ser Ala Gly Ser Glu Leu Cys 
420 425 430 

Leu Gin Gin Pro Val Glu Arg Lys Leu 
435 440 

<210> 10 

<211> 1326 

<212> ADN 

<213> Homo sapiens 



<400> 10 

atgaacaagc tgagtggagg cggcgggcgc aggactcggg tggaaggggg ccagcttggg 60 
ggcgaggagt ggacccgcca cgggagcttt gtcaataagc ccacgcgggg ctggctgcat 120 



WO 99/46403 



cccaacgaca aagtcatggg acccggggtt 
gaggtcctcc agtcaatgcg tgccctggac 
gccatcagtc tggtgtgtga ggctgtgccg 
ccctgtagcc gcccgctcag ctctatcctg 
ccaatcactc tcaccgtctc caccagcagc 
atcatcgcca accaccacat gcaatctatc 
gccgagtatg tcgcctatgt tgccaaagac 
gagtgtcccg aagggcttgc ccaggatgtc 
cgcttcaaac aatacctcag gaacccaccc 
ggctttgatg gctcagcatg ggatgaggag 
aatgacttcc cggggaagga accccccttg 
ggagccgctc caggggctgc tcgacccact 
ggagctacat tgcctgtagg acagcctgtt 
ccacctccac caccctgtcc aggcagagag 
cagaacctag acaaggcccg gcaagcagtg 
aatggcagtg caccccggga cctgtttgac 
cctccacctc cccagtcggt gtccatggct 
gggaagctga gccggcggga ggctgaggca 
cggactaagg atcaccgctt tgaaagtgtc 
cacttgccca tcatctctgc gggcagcgaa 
ctgtga . 

<210> 11 

<211> 19 

<212> ADN 

<213> Sequence artif icielle 
<220> 

<223> Description de la sequence 

<400> 11 

tgcccaaatc aacaagagc 

<210> 12 
<211> 19 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence 
<400> 12 

cccctgacaa gcctgaata 



5 



tcctacttgg ttcggtacat 


gggttgtgtg 


180 


ttcaacaccc 


ggactcaggt 


caccagggag 


240 


ggtgctaagg 


gggcgacaag 


gaggagaaag 


300 


gggaggagta 


acctgaaatt 


tgctggaatg 


360 


ctcaacctca 


tggccgcaga 


ctgcaaacag 


420 


tcatttgcat 


ccggcgggga 


tccggacaca 


480 


cctgtgaatc 


agagagcctg 


ccacattctg 


540 


atcagcacca 


ttggccaggc 


cttcgagttg 


600 


aaactggtca 


cccctcatga 


caggatggct 


660 


gaggaagagc 


cacctgacca 


tcagtactat 


720 


gggggggtgg 


tagacatgag 


gcttcgggaa 


780 


gcacccaatg 


cccagacccc 


cagccacttg 


840 


gggggagatC 


cagaagtccg 


caaacagatg 


900 


ctttttgatg 


atccctccta 


tgtcaacgtc 


960 


ggtggtgctg 


ggccccccaa 


tcctgctatc 


1020 


atgaagccct 


tcgaagatgc 


tcttcgggtg 


1080 


gagcagctcc 


gaggggagcc 


ctggttccat 


1140 


ctgctgcagc 


tcaatgggga 


cttcttggtt 


1200 


agtcacctta 


tcagctacca 


catggacaat 


1260 


ctgtgtctac 


agcaacctgt 


ggagcggaaa 


1320 
1326 



artificielle : OLIGO 
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artificielle : OLIGO 
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<210> 13 
<211> 24 
<212> ADN 



wo yy/4(>4iu 



<213> Sequence artificielle 
<220> 

<223> Description de la sequence 
<400> 13 

atgtctcaga gcaaccggga gctg 

<210> 14 
<211> 24 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence 
<400> 14 

gtggctccat tcaccgcggg gctg 

<210> 15 

<211> 19 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence 
<400> 15 

tgccaagaag ggaaggagt 

<210> 16 
<211> 20 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence 
<400> 16 

tgtcatgact ccagcaatag 



artificielle: OLIGO 
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artificielle : OLIGO 
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artificielle: OLIGO 
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artificielle : OLIGO 
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